Accueil Technologie compression des données

compression des données



Résumé

Foranyformofcommunication, compresseddatacommunicationcanonlyworkwhenthesenderandreceiveroftheinformationcanunderstandtheencodingmechanism.Forexample, thearticleismeaningfulonlyiftherecipientknowsthatthearticleneedstobeexplainedinEnglishcharacters.Similarly, onlywhentherecipientknowstheencodingmethodcanheunderstandthecompresseddata.Somecompressionalgorithmstakeadvantageofthisfeaturetoencryptdataduringthecompressionprocess, suchasusingpasswordencryptiontoensurethatonlyauthorizedpartiescanobtainthedatacorrectly.

La compression des données peut être réalisée car la plupart des données du monde réel présentent une redondance statistique.

Si un certain degré de perte de fidélité est autorisé, une compression supplémentaire peut être obtenue. Par exemple, lorsque les gens regardent des images ou des écrans de télévision, ils peuvent ne pas remarquer que certains détails sont imparfaits.

Parce qu'elle peut aider à réduire la consommation de ressources coûteuses telles que l'espace disque dur et la bande passante de connexion, la compression est très importante. Cependant, la compression nécessite des ressources de traitement des informations, qui peuvent également être coûteuses.

Certains mécanismes sont réversibles, afin que les données d'origine puissent être restaurées.

Cependant, il existe souvent des fichiers qui ne peuvent pas être compressés par des algorithmes de compression de données sans perte. En fait, tout algorithme de compression de données qui ne contient pas de motifs discernables ne peut pas être compressé.

En fait, la compression des données avec perte finira par atteindre le point où elle ne fonctionnera plus. Prenons un exemple extrême.

Classification

Il existe de nombreuses méthodes de compression des données.

(1) Compression en temps réel et non en temps réel

Parexemple,pourfaireunappeltéléphoniqueIPpourconvertirlesignalvocalensignalnumérique,lecompresserenmêmetemps,puisletransmettreviaInternet.CettecompressiondesdonnéesLeprocessusestinstantané.

La compression non instantanée est souvent utilisée par les utilisateurs d'ordinateurs. Ce type de compression est effectué en cas de besoin et n'a pas d'instantanéité.

(2) Compression des données et compression des fichiers

En fait, la compression des données inclut la compression des fichiers.

(3) Compression sans perte et compression avec perte

Losslesscompressionusesstatisticalredundancyofdataforcompression.Thetheoreticallimitofdatastatisticalredundancyis2: 1to5: 1, sothecompressionratiooflosslesscompressionisgenerallylower.Thistypeofmethodiswidelyusedintextdata, programmes, andimagedatainspecialapplicationsthatrequireprecisestorageofdatacompression.Thelossycompressionmethodtakesadvantageoftheinsensitivityofhumanvisionandhearingtocertainfrequencycomponentsinimagesandsounds, allowingacertainamountofinformationtobelostduringthecompressionprocess.Althoughtheoriginaldatacannotbecompletelyrestored, thelostparthaslessimpactontheunderstandingoftheoriginalimage, butinexchangeforalargercompressionratio.Lossycompressioniswidelyusedinthecompressionofvoice, imageandvideodata.

Principe

Enfait, therearemanydataredundancyinmultimediainformation.Forexample, ifmanypixelsarethesameinthestaticbuildingbackground, blueskyandgreenspaceinanimage, ifstoredpointbypoint, alotofspacewillbewasted.Thisiscalledspatialredundancy.Foranotherexample, intheadjacentsequenceofTVandanimation, onlymovingobjectshavealittlechange, andonlythedifferencepartcanbestored.Thisiscalledtimeredundancy.Inaddition, therearestructuralredundancy, visualredundancy, etc., whichprovideconditionsfordatacompression.

Bref, la base théorique de la compression est la théorie de l'information.

Application

Averysimplecompressionmethodisrun-lengthencoding.Thismethodusessimpleencodingsuchasdataanddatalengthtoreplacethesamecontinuousdata.Thisislosslessdatacompression.Aninstanceof.Thismethodisoftenusedinofficecomputerstomakebetteruseofdiskspace, ortomakebetteruseofbandwidthinacomputernetwork.Forsymbolicdatasuchasspreadsheets, texte, executablefiles, etc., losslessnessisaverycriticalrequirement, becauseinmostcases, evenasingledatabitchangeisunacceptableexceptforsomelimitedcircumstances.

Pour les données vidéo et audio, un certain degré de dégradation de la qualité est acceptable tant qu'une partie importante des données n'est pas perdue.

La compression d'image avec perte est utilisée sur les appareils photo numériques pour augmenter considérablement la capacité de stockage, alors que la qualité de l'image n'est presque pas réduite.

Inlossyaudiocompression, psychoacousticmethodsareusedtoremoveinaudibleordifficulttohearcomponentsfromthesignal.Thecompressionofhumanspeechoftenusesmorespecializedtechniques, sopeoplesometimesdistinguish "speechcompression" ou "speechcoding" asanindependentresearchfieldfrom "audiocompression" .Differentaudioandvoicecompressionstandardsbelongtothecategoryofaudiocodecs.Forexample, voicecompressionisusedforInternettelephony, whileaudiocompressionisusedforCDrippinganddecodingwithMP3players.

Théorie

Thetheoreticalbasisofcompressionisinformationtheory (itiscloselyrelatedtoalgorithmicinformationtheory) Andrate-distortiontheory.TheresearchworkinthisfieldismainlylaidbyClaudeShannon.Fundamentalpapersinthisareawerepublishedinthelate1940sandearly1950s.DoyleandCarlsonwrotein2000thatdatacompression "hasoneofthesimplestandmostbeautifuldesigntheoriesinallengineeringfields." Cryptographyandcodingtheoryarealsocloselyrelateddisciplines, andtheideaof datacompressionhasadeepconnectionwithstatisticalinference.

De nombreux systèmes de compression de données sans perte peuvent être considérés comme des modèles en quatre étapes.

Algorithmes populaires

Lempel-Ziv (LZ) compressionmethodisoneofthemostpopularlosslessstoragealgorithms.DEFLATEisavariantofLZ, itisoptimizedfordecompressionspeedandcompressionrate, méthode althoughitscompressionspeedmaybeveryslow, PKZIP, gzipandPNGareallusingDEFLATE.LZW (Lempel-Ziv-Welch) isaUnisyspatentuntiltheexpirationdateofthepatentinJune2003.ThismethodisusedforGIFimages.AlsoworthmentioningistheLZR (LZ-Renau), whichisthebasisoftheZipmethod.TheLZmethodusesatable-basedcompressionmodel, inwhichtheentriesinthetablearereplacedwithrepeateddatastrings.FormostLZmethods, thistableisdynamicallygeneratedfromtheinitialinputdata. Cette table est souvent gérée à l'aide du codage de Huffman (par exemple, SHRI, LZX).

Codage algorithmique

Thebestcompressiontoolusesthepredictionresultsoftheprobabilitymodelforarithmeticcoding.ArithmeticcodingwasinventedbyJormaRissanenandturnedintoapracticalmethodbyWitten, Neal, andCleary.Thismethodcanachievebettercompressionthanthewell-knownHuffmanalgorithm, anditisverysuitableforadaptivedatacompression.Thepredictionofadaptivedatacompressioniscloselyrelatedtothecontext.ArithmeticcodinghasbeenusedinthebinaryimagecompressionstandardJBIGandthedocumentcompressionstandardDejaVu.ThetextinputsystemDasherisaninversearithmeticencoder.

Taper

La compression des données peut être divisée en deux types, l'un est appelé compression sans perte et l'autre est appelé compression avec perte.

Losslesscompressionreferstotheuseofcompresseddataforreconstruction (orrestoring, décompression), thereconstructeddataisexactlythesameastheoriginaldata; losslesscompressionisusedforsignalsthatrequirereconstructionandWhentheoriginalsignalisexactlythesame.Averycommonexampleisthecompressionofdiskfiles.Thelosslesscompressionalgorithmcangenerallycompressthedataofordinaryfilesto1 / 2to1 / 4oftheoriginal.SomecommonlyusedlosslesscompressionalgorithmsareHuffman (Huffman) algorithmandLZW (Lenpel-Ziv & Welch) CompressionAlgorithm.

Lossycompressionreferstotheuseofcompresseddataforreconstruction.Thereconstructeddataisdifferentfromtheoriginaldata, butitdoesnotaffectpeople'smisunderstandingoftheinformationexpressedbytheoriginaldata.Lossycompressionissuitableforoccasionswherethereconstructedsignaldoesnothavetobeexactlythesameastheoriginalsignal.Forexample, lossycompressioncanbeusedforimageandsoundcompression, becauseitoftencontainsmoredatathanourvisualsystemandauditorysystemcanreceive, andsomedataislostsoasnottoproducethemeaningexpressedbysoundorimage.Misunderstanding, butcangreatlyimprovethecompressionratio.

Cet article provient du réseau, ne représente pas la position de cette station. Veuillez indiquer l'origine de la réimpression
HAUT