Want to create interactive content? It’s easy in Genially!

Get started free

Codificación Y Almacenamiento del Sonido

DANIEL TEIXEIRA

Created on February 23, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Smart Presentation

Practical Presentation

Essential Presentation

Akihabara Presentation

Pastel Color Presentation

Visual Presentation

Relaxing Presentation

Transcript

CODIFICACIÓN

Y ALMACENAMIENTO DEL SONIDO

Daniel Teixeira Castro

Índice

Sonido Envolvente y Codificación Multicanal

Digitalización del Sonido

Códecs

Sistemas de Almacenamiento Digital

Formatos de Grabación Magnéticos y ópticos

Sistemas de Almacenamiento Informatico

01

Digitalización del Sonido

1-Introducción

La digitalización del sonido ha sido uno de los avances tecnológicos más significativos en la historia de la música, el cine, la comunicación y muchas otras áreas. Este proceso ha revolucionado la forma en que percibimos, creamos y manipulamos el sonido en la era moderna. En su esencia, la digitalización del sonido se refiere a la conversión de señales de audio analógicas en datos digitales, los cuales pueden ser almacenados, procesados y transmitidos de manera eficiente y precisa a través de dispositivos electrónicos.

+ info

2-Fases de la digitalización

Muestreo: El proceso de muestreo implica tomar mediciones periódicas de la señal de audio analógica a intervalos regulares de tiempo. Se utiliza un dispositivo llamado convertidor analógico-digital (ADC) para realizar esta tarea. Durante el muestreo, la señal de audio analógica se divide en pequeñas muestras discretas que representan su amplitud en un momento dado. La frecuencia de muestreo, medida en hercios (Hz), determina cuántas muestras se toman por segundo. Por ejemplo, una frecuencia de muestreo de 44.1 kHz significa que se toman 44,100 muestras por segundo. El teorema de muestreo de Nyquist establece que la frecuencia de muestreo debe ser al menos el doble de la frecuencia máxima audible en la señal para evitar la pérdida de información.

+ info

2-Fases de la digitalización

+ info

2-Fases de la digitalización

Cuantificación: Después de que la señal de audio ha sido muestreada, se cuantifica para representar su amplitud en cada punto de muestreo. En esta etapa, se asigna un valor numérico a cada muestra de acuerdo con su amplitud. La cuantificación se realiza dividiendo el rango de amplitudes posibles en un cierto número de niveles discretos. La precisión de la cuantificación se determina por la cantidad de bits utilizados para representar cada muestra. Por ejemplo, en una cuantificación de 16 bits, se utilizan 16 bits para representar la amplitud de cada muestra, lo que permite una mayor resolución que una cuantificación de 8 bits.

+ info

+ info

2-Fases de la digitalización

Codificación: En esta fase, las muestras cuantificadas se codifican en un formato de archivo de audio digital. El formato más común para la codificación de audio es el formato de pulso modulado por código (PCM), que almacena las muestras como una secuencia de números binarios. Otros formatos populares incluyen el formato de audio comprimido, como MP3, AAC o FLAC, que utilizan algoritmos de compresión para reducir el tamaño del archivo sin perder demasiada calidad de audio.

+ info

3-Inconvenientes de la digitalización

Inframuestreo: si se utiliza una frecuencia de muestreo (fm) baja, se limita el ancho de banda de la señal de audio y, por tanto, se eliminan los sonidos agudos. Para evitar este problema, se debe cumplir el teorema de Nyquist, que establece que la fm debe ser al menos el doble de la frecuencia máxima de la señal original. Infracuantificación: si se asigna un valor n bajo, se percibe una señal muy ruidosa debido al gran error de cuantificación que se comete en la mayoría de las muestras. El error de cuantificación es la diferencia entre el valor real de la muestra y el valor asignado por la cuantificación. Para reducir este error, se debe aumentar el número de bits por muestra (n) y el número de niveles de cuantificación (N), que están relacionados por la fórmula

+ info

3-Inconvenientes de la digitalización

Multiplexación: la señal de audio generalmente consta de dos canales (derecho e izquierdo) y la grabación/transmisión de más de un canal en un solo flujo de datos binarios conlleva un proceso de intercalado de muestras de los canales y, por lo tanto, de una sincronización adecuada que permita en recepción separar los canales como estaban en origen. Este proceso puede aumentar la complejidad y el coste de los sistemas de digitalización y requerir más ancho de banda o mayor compresión de datos.Saturación: se trata del exceso de nivel de tensión de la señal analógica a la entrada del conversor analógico-digital (CAD). Cualquier señal por encima del nivel máximo admisible por el conversor (señal saturada), se cuantificará y codificará con el nivel más alto, lo que producirá un efecto de chasquido (clipping digital). La saturación se evita controlando la ganancia a la entrada de los conversores CAD mediante atenuadores o procesadores de dinámica (compresores y limitadores).

+ info

3-Inconvenientes de la digitalización

+ info

02

Códecs

4-Códecs sin Compresión

PCM (Pulse Code Modulation): es el método más simple y común de digitalizar el sonido, que consiste en tomar muestras de la señal analógica a intervalos regulares y asignarles un valor numérico según su amplitud. PCM es la base de los formatos WAV y AIFF, que son contenedores que almacenan los datos PCM junto con otros metadatos, como la frecuencia de muestreo, el número de canales, el número de bits por muestra, etc. WAV (Waveform Audio File Format): es un formato de archivo de audio desarrollado por Microsoft e IBM, que se utiliza principalmente en sistemas Windows. Los archivos WAV tienen la extensión “.wav” y pueden almacenar audio PCM sin comprimir o comprimido con otros códecs, como MP3 o FLAC. El tamaño máximo de un archivo WAV estándar es de 4 GB, pero se puede superar con el formato WAV RF64. AIFF (Audio Interchange File Format): es un formato de archivo de audio desarrollado por Apple, que se utiliza principalmente en sistemas Mac. Los archivos AIFF tienen la extensión “.aiff” o “.aif” y pueden almacenar audio PCM sin comprimir o comprimido con otros códecs, como MP3 o ALAC. El tamaño máximo de un archivo AIFF es de 2 GB, pero se puede superar con el formato AIFF-C.

+ info

+ info

5-Códecs con Compresión sin Pérdidas

FLAC (Free Lossless Audio Codec): es uno de los códecs sin pérdida más populares y ampliamente compatibles. FLAC admite una resolución de audio de hasta 384 kHz / 32 bits y puede comprimir el audio hasta un 60% de su tamaño original. FLAC también admite metadatos, como etiquetas ID3, portadas de álbumes y letras. Los archivos FLAC tienen la extensión “.flac” y se pueden reproducir en la mayoría de los reproductores de audio y dispositivos. Monkey’s Audio (APE): es otro códec sin pérdida que ofrece una alta calidad de sonido y una compresión eficiente. APE comprime el audio bit a bit, alcanzando relaciones de datos de hasta 700 kbps sin pérdida alguna de calidad. APE también admite metadatos y tiene la ventaja de ser de código abierto. Sin embargo, APE tiene una compatibilidad limitada con algunos sistemas operativos y dispositivos, y solo está disponible oficialmente para Windows. Los archivos APE tienen la extensión “.ape” y se pueden reproducir con algunos reproductores de audio, como Foobar2000 o VLC.

+ info

+ info

6-Códecs con Compresión y Pérdidas

AAC (Advanced Audio Coding): es un códec desarrollado por el grupo MPEG que ofrece una mejor calidad de sonido que el MP3 a la misma tasa de bits. Es el formato de audio predeterminado para iTunes, iPod, iPhone y iPad. Los archivos AAC tienen la extensión “.aac” o “.m4a”. MP3 (MPEG Audio Layer III): es el códec más popular y extendido para el audio digital. Tiene una buena relación entre calidad y tamaño de archivo, y es compatible con la mayoría de los reproductores de audio y dispositivos. Los archivos MP3 tienen la extensión “.mp3”. Ogg Vorbis: es un códec de código abierto y libre de patentes que ofrece una calidad de sonido similar o superior al MP3 a una menor tasa de bits. Es el formato de audio preferido para algunos servicios de streaming, como Spotify. Los archivos Ogg Vorbis tienen la extensión “.ogg” o “.oga”.

+ info

7-Códecs con Compresión y Pérdidas

WMA (Windows Media Audio): es un códec desarrollado por Microsoft que tiene una calidad de sonido comparable al MP3 a una menor tasa de bits. Es el formato de audio predeterminado para Windows Media Player y algunos dispositivos de Microsoft. Los archivos WMA tienen la extensión “.wma”. ADPCM (Adaptive Differential Pulse Code Modulation): es un códec que utiliza una técnica de modulación de pulsos que reduce el número de bits por muestra al codificar solo la diferencia entre muestras consecutivas. Se utiliza para el audio de baja calidad y baja tasa de bits, como el de los videojuegos o los mensajes de voz. Los archivos ADPCM pueden tener diferentes extensiones, como “.adpcm”, “.wav” o “.ima”. ATRAC (Adaptive Transform Acoustic Coding): es un códec desarrollado por Sony que se utiliza para el audio de alta calidad y alta tasa de bits, como el de los discos MiniDisc o los reproductores de audio portátiles de Sony. Los archivos ATRAC tienen la extensión “.atrac”, “.oma” o “.aa3”.

+ info

+ info

03

Sistemas de Almacenamiento Digital

8-Sistemas de Almacenamiento Digital

Los sistemas de almacenamiento digital son medios que permiten guardar, organizar y compartir información en formato digital, como documentos, imágenes, vídeos, sonidos, etc. Los sistemas de almacenamiento digital se pueden clasificar según el tipo de dispositivo, la forma de los datos, el nivel de compresión y la ubicación de los datos. Los principales tipos de dispositivos de almacenamiento digital son: Discos: son dispositivos que utilizan el magnetismo o la electricidad para grabar y leer los datos. Los discos más comunes son los discos duros (HDD) y los discos de estado sólido (SSD). Memorias: son dispositivos que utilizan circuitos integrados para almacenar y acceder a los datos. Las memorias más comunes son la memoria de acceso aleatorio (RAM) y la memoria flash. Cintas: son dispositivos que utilizan cintas magnéticas para almacenar y recuperar los datos. Las cintas se usan principalmente para hacer copias de seguridad o archivar datos a largo plazo. Ópticos: son dispositivos que utilizan la luz láser para grabar y leer los datos. Los ópticos más comunes son los CD, DVD y Blu-ray.

+ info

9-Sistemas de grabación Magnéticos y Ópticos

La grabación magnética: consiste en crear un campo magnético variable en el medio de almacenamiento, que representa la información a grabar. Este campo magnético se puede leer posteriormente con un cabezal de lectura, que convierte el campo magnético en una señal eléctrica. La grabación magnética se utiliza, por ejemplo, en los discos duros, las cintas de audio o las cintas de video. La grabación óptica: consiste en crear marcas o huecos en el medio de almacenamiento, que reflejan o dispersan la luz de forma diferente, representando la información a grabar. Estas marcas o huecos se pueden leer posteriormente con un láser, que detecta los cambios de reflexión o difracción de la luz. La grabación óptica se utiliza, por ejemplo, en los CD, DVD o Blu-ray. La grabación magneto-óptica: es una combinación de las dos tecnologías anteriores, que utiliza un láser para calentar el medio de almacenamiento y un campo magnético para grabar la información. Este proceso permite una mayor densidad de grabación y una mayor durabilidad del medio. La grabación magneto-óptica se utiliza, por ejemplo, en los discos magneto-ópticos o los discos Zip.

+ info

+ info

+ info

04

Formatos de Grabación Magnéticos y Ópticos

10-Sistemas de grabación Magnéticos

DAT (Digital Audio Tape): es un formato desarrollado por Sony en 1987, que permite grabar hasta dos pistas de audio con una resolución de 16 bits y una frecuencia de muestreo de 44,1 o 48 kHz. Utiliza una cinta de vídeo de 4 mm de ancho y se puede reproducir en la mayoría de los reproductores de DAT. MDM (Modular Digital Multitrack): es un término genérico que engloba a varios formatos que utilizan una cinta de vídeo de 8 mm de ancho para grabar hasta ocho pistas de audio con una resolución de 16 o 24 bits y una frecuencia de muestreo de 44,1 o 48 kHz. Algunos de los formatos MDM más conocidos son el ADAT, el DA-88 y el DTRS. ADAT (Alesis Digital Audio Tape): es un formato desarrollado por Alesis en 1991, que utiliza una cinta de vídeo S-VHS para grabar hasta ocho pistas de audio con una resolución de 16 bits y una frecuencia de muestreo de 44,1 o 48 kHz. Se puede sincronizar con otros dispositivos ADAT mediante una conexión óptica llamada ADAT Lightpipe.

+ info

+ info

11-Formatos de grabación Magnéticos Actuales

DDS (Digital Data Storage): es un formato derivado del DAT (Digital Audio Tape), que utiliza una cinta magnética de 4 mm de ancho para grabar hasta 80 GB de datos con una compresión sin pérdida. Se utiliza para el almacenamiento de datos en pequeñas y medianas empresas. LTO (Linear Tape-Open): es un formato estándar y abierto, que utiliza una cinta magnética de 12,65 mm de ancho para grabar hasta 18 TB de datos con una compresión sin pérdida. También permite la compresión con pérdida y el encriptado de datos. Se utiliza para el almacenamiento de datos en grandes empresas y centros de datos. DLT (Digital Linear Tape): es un formato propietario, que utiliza una cinta magnética de 12,7 mm de ancho para grabar hasta 800 GB de datos con una compresión sin pérdida. También permite la compresión con pérdida y el encriptado de datos. Se utiliza para el almacenamiento de datos en medianas y grandes empresas.

+ info

12-Formatos de grabación Ópticos

CD (Compact Disc): es un formato desarrollado por Philips y Sony en 1982, que permite grabar hasta 700 MB de datos o 80 minutos de audio con una resolución de 16 bits y una frecuencia de muestreo de 44,1 kHz. Utiliza un disco de policarbonato de 12 cm de diámetro y 1,2 mm de grosor, que se graba y se lee con un láser de luz roja. DVD (Digital Versatile Disc): es un formato desarrollado por varias empresas en 1995, que permite grabar hasta 4,7 GB de datos o 120 minutos de video con una resolución de 720 x 576 píxeles. Utiliza un disco de policarbonato de 12 cm de diámetro y 1,2 mm de grosor, que se graba y se lee con un láser de luz roja. Blu-ray: es un formato desarrollado por varias empresas en 2006, que permite grabar hasta 25 GB de datos o 135 minutos de video con una resolución de 1920 x 1080 píxeles. Utiliza un disco de policarbonato de 12 cm de diámetro y 1,2 mm de grosor, que se graba y se lee con un láser de luz azul.

+ info

+ info

12-Formatos de grabación Ópticos

LaserDisc: es un formato desarrollado por Philips y MCA en 1978, que permite grabar hasta 60 minutos de video con una resolución de 425 x 480 píxeles. Utiliza un disco de aluminio de 30 cm de diámetro y 2,5 mm de grosor, que se graba y se lee con un láser de luz roja. LaserCard: es un formato desarrollado por Drexler Technology Corporation en 1979, que permite grabar hasta 2 MB de datos con una resolución de 300 dpi. Utiliza una tarjeta de plástico de 8,6 x 5,4 cm y 0,8 mm de grosor, que se graba y se lee con un láser de luz roja.

+ info

05

Sistemas de Almacenamiento Informatico

13-Sistemas de Almacenamiento Informatico

Los discos duros HDD (Hard Disk Drive): son dispositivos que utilizan el magnetismo para grabar y leer los datos en uno o varios discos rígidos que giran a gran velocidad. Los discos duros HDD tienen la ventaja de ofrecer una gran capacidad de almacenamiento a un bajo coste, pero también el inconveniente de ser más lentos, ruidosos y vulnerables a los golpes que los discos duros SSD. Los discos duros SSD (Solid State Drive): son dispositivos que utilizan circuitos integrados para almacenar y acceder a los datos sin partes móviles. Los discos duros SSD tienen la ventaja de ofrecer una mayor velocidad, silencio y resistencia que los discos duros HDD, pero también el inconveniente de ser más caros y tener una menor vida útil que los discos duros HDD. Las tarjetas flash: son un tipo de memoria no volátil que se utiliza para almacenar datos en dispositivos portátiles, como cámaras digitales, teléfonos móviles o reproductores de música. Las tarjetas flash tienen la ventaja de ser pequeñas, ligeras y resistentes a los golpes, pero también el inconveniente de tener una capacidad de almacenamiento limitada y una vida útil finita. Existen diferentes tipos de tarjetas flash, como SD, microSD, CF o MMC.

+ info

+ info

06

Sonido Envolvente y Codificación Multicanal

13-Sonido envolvente y codificación Multicanal

El sonido envolvente: es el efecto que se produce cuando el sonido proviene de diferentes direcciones y distancias, simulando un entorno real. Para lograr este efecto, se utilizan sistemas de altavoces que se distribuyen alrededor del oyente, como el 5.1, el 7.1 o el Dolby Atmos. La codificación multicanal: es el proceso de comprimir y codificar el audio en varios canales, que se pueden transmitir o almacenar en un formato digital. La codificación multicanal permite conservar la calidad y la separación del sonido original, y facilita su reproducción en sistemas de sonido envolvente. Algunos ejemplos de formatos de codificación multicanal son el AC-3, el DTS, el AAC o el FLAC.

+ info

13-Sonido envolvente y codificación Multicanal

El sonido inmersivo es el efecto que se produce cuando el sonido envuelve al oyente en un espacio tridimensional, creando una sensación de realismo y profundidad. Para lograr este efecto, se utilizan sistemas de sonido que incorporan canales de altura y/o canales de objetos, que permiten ubicar los sonidos en cualquier punto del espacio. Algunos ejemplos de formatos de sonido inmersivo son el Dolby Atmos, el DTS:X o el Auro-3D. El Dolby Pro Logic es una tecnología de sonido que permite obtener un sonido envolvente a partir de una señal estéreo. El Dolby Pro Logic utiliza un proceso de codificación y decodificación que extrae cuatro canales de sonido (central, izquierdo, derecho y trasero) de una señal de dos canales. El Dolby Pro Logic se utiliza principalmente para el sonido de las películas en VHS o DVD.

+ info

13-Sonido envolvente y codificación Multicanal

Los sistemas de cine en casa son conjuntos de dispositivos que permiten disfrutar del sonido y la imagen de las películas en el hogar, con una calidad similar a la de una sala de cine. Los sistemas de cine en casa se componen de los siguientes elementos principales: Reproductor: es el dispositivo que lee el formato de audio y video de la fuente, como un Blu-ray, un DVD o un disco duro. Receptor: es el dispositivo que recibe la señal de audio y video del reproductor, la procesa y la envía a los altavoces y al proyector o televisor. Altavoces: son los dispositivos que convierten la señal de audio en sonido. El número y la posición de los altavoces depende del formato de sonido que se utilice, pero en general se siguen las normas del sonido envolvente. Proyector o televisor: es el dispositivo que convierte la señal de video en imagen. El tamaño y la resolución de la pantalla depende de la calidad de la fuente y de la distancia de visionado.

+ info

Sistemas de Grabacion Magnéticos y Ópticos

Los sistemas de grabación magnética y óptica son dos tipos de tecnologías que se utilizan para almacenar y recuperar información en forma de audio, video o datos. Ambas tecnologías utilizan un medio de almacenamiento, como una cinta o un disco, que se puede modificar mediante un campo magnético o un haz de luz, respectivamente.

Códecs con compresión sin Pérdidas

Los códecs con compresión sin pérdidas son aquellos que reducen el tamaño de los archivos de audio sin afectar la calidad del sonido. Estos códecs son útiles para ahorrar espacio de almacenamiento y ancho de banda, sin sacrificar la fidelidad del audio original.

Formatos de Grabación Ópticos

Los formatos de grabación ópticos son aquellos que utilizan un medio óptico, como un disco o una tarjeta, para almacenar información en forma de marcas o huecos que reflejan o dispersan la luz de forma diferente. Estos formatos tienen la ventaja de ofrecer una mayor calidad y durabilidad que los formatos magnéticos, pero también el inconveniente de ser más sensibles a los arañazos y al polvo.

Cuantificación

Los códecs sin compresión PCM, WAV y AIFF son formatos de archivo de audio que almacenan la información de sonido de forma íntegra, sin eliminar ni modificar ningún dato. Estos formatos tienen la ventaja de ofrecer la máxima calidad de sonido, pero también el inconveniente de ocupar mucho espacio de almacenamiento.

Formato de Grabación Magnético

Los formatos de grabación magnética digital DAT, MDM, ADAT, DA-88 y DTRS son algunos de los sistemas que utilizan una cinta magnética de vídeo (Hi8 o S-VHS) para la grabación digital multipista de audio. Estos formatos se diferencian en el tipo de cinta, el número de pistas, la resolución y la compatibilidad que ofrecen.

Códecs sin compresión

Los códecs sin compresión PCM, WAV y AIFF son formatos de archivo de audio que almacenan la información de sonido de forma íntegra, sin eliminar ni modificar ningún dato. Estos formatos tienen la ventaja de ofrecer la máxima calidad de sonido, pero también el inconveniente de ocupar mucho espacio de almacenamiento.

Sistemas de Almacenamiento Informatico

Los sistemas de almacenamiento informático son medios que permiten guardar, organizar y compartir información en formato digital, como documentos, imágenes, vídeos, sonidos, etc. Los sistemas de almacenamiento informático se pueden clasificar según el tipo de dispositivo, la forma de los datos, el nivel de compresión y la ubicación de los datos.