E D R , A S I H C RSS

AAC

Advanced Audio Coding. '고급 오디오 부호화'라고도 한다.

Contents

1. 개요
2. 용도
3. 오해

1. 개요

MP3를 대중화시키고 개발까지 한 프라운호퍼의 MP3 코덱을 개선하기 위해 MPEG(위원회)과 AT&T 벨 연구소, 프라운호퍼, 돌비 연구소, 소니 등 기업에서 공동으로 개발한 오디오 코덱이라지만...

사실은 MPEG-1의 일부로서 개발된 MP2, MP3 코덱에 적용되지 못했던 새로운 압축기술들이 적용되었기 때문에 구조적으로 MP3 포맷과 너무 많이 다르다. 따라서 MP3 포맷에 대한 하위 호환성이 없다. 대신 MP3 포맷보다 압축 효율성이 높아졌다.

AAC 포맷은 MPEG-2와 MPEG-4의 일부에 포함되어 있으며 MPEG-2 AAC와 MPEG-4 AAC로 나뉜다. 용도에 따른 압축 모드에 따라 LC, HC, AVC HC 등이 있다. 일부 MP3 플레이어에 호환되는 것은 LC 타입. 압축효율성은 타입에 따라서 WMAOGG(Vorbis) 사이 또는 OGG 수준에 있다고 보면 된다. 현재 제일 많이 쓰이는 AAC류의 압축 포맷인 apple 코덱의 압축률은 VBR에서 OGG보다 약간 밀리는 정도이며,CBR의 경우 OGG가 취약한 부분이기 때문에 AAC가 상대적으로 앞선다.
개선점으로는 다음과 같다.

  • 샘플 주파수의 확장 (MP3에서는 8Khz ~ 48Khz까지였으나 8Khz ~ 96Khz로 확장)
  • 최대 48채널로 확장 (MPEG-1 모드에서는 2채널, MPEG-2 모드에서는 5.1채널이 최대)
  • 고정 비트레이트에서도 필요에 따라서 비트를 가변적으로 할당한다.
  • 조인트 스테레오가 더욱 유용해졌다. 그리하여 저 비트레이트에서 음이 뭉개지는 현상을 개선하였다.또한 저 비트레이트에서의 음 손실이 많이 줄었다.
  • 알고리즘을 하이브리드(Hybrid) 형식에서 수정 이산 코사인 변환(Pure MDCT) 형식으로 바꾸어서 더욱 효율적인 인코딩이 가능해졌다.

이외에도 AAC는 기존 MP3가 가지던 문제의 대부분을 획기적으로 개선했으며 특히 HE-AAC[1]에서는 저 비트레이트에서도 음역 보존률이 아주 좋다.다만 SBR의 특성상 고주파 껍데기는 잘 따라가지만 하모닉스와 같은 표현에는 쥐약이라는 반론이 있고 압축하기 어려운 음원의 경우 블라인드 테스트에서 좋지 못한 결과를 보였다.사실 그렇게 멀리갈 것 없이,전자 음악만 출동해도 FLAC와 붙을때 ABX테스트에서 변별되어 버린다. 아래의 스펙트럼 테스트에서 나온 대표적인 맹점 중에 하나이다. 다시 말해, 단순히 스펙트럼으로 떠드는 것은 손실 압축 포맷 특유의 아티펙트(artifact) 현상을 간과하는 처사일 수 있다.

가장 최근 표준화된 MPEG Surround 에서도 baseline으로 AAC가 기본적으로 사용될 수 있다.

최대 비트레이트도 MP3보다 늘어났는데 MP3는 320k까지인 반면 AAC는 500k까지 늘어났다.

또한 AAC와 MP3의 용량을 비교하였더니 (CBR 320k , Joint stereo) MP3는 5,158KB, AAC는 5,184KB로 약 26KB 정도가 차이가 난다[2].


2. 용도

H.264로 인코딩된 인터넷 스트리밍 동영상(대표적으로 유튜브, 네이버 동영상) 및 MP4 동영상 파일의 대부분이 이 오디오 코덱이 쓰이는 경우가 많다. 동영상 스트리밍 외에도 멜론 등 음원 스트리밍 서비스에서도 기본값으로 AAC를 지원한다.

2010년경 이후 영국 BBC, 미국 NPR의 일부 회원국 등 외국의 주요 라디오 방송국에서 스트리밍 오디오용 코덱으로 많이 쓰이고 있다. 외국 방송국의 음악채널, 특히 좀 유명하다 싶은 클래식 음악 채널은 아예 인터넷 스트리밍이 AAC가 기본값. 특히 충격과 공포BBC Radio 3 320 kbps AAC 스트리밍. 한국에선 64 kbps WMA도 외부링크 따는 걸 꽁꽁 막아놓고 쓰는 데 네트워크 장비값을 어떻게 감당하려고... 한국에서도 스트리밍 방송에 오디오 코덱으로 쓰이는 데가 늘고 있다. 일본의 온라인 라디오 스트리밍 서비스인 '라디코'도 HE AAC 48kbps로 서비스된다.

구형 DAB가 아닌 신형 DAB+ 디지털 라디오 방송에도 쓰인다. 한국의 DMB 오디오부의 코덱은 이 포맷의 변형인 BSAC 코덱이 사용된다. 그러나 BSAC는 오디오부 코덱치고는 매우 안좋은 코덱에 속한다. Opus같은 코덱으로의 빠른 교체가 시급해 보인다. 일본과 남미에서 쓰이는 원세그도 AAC 코덱이 쓰인다.

안드로이드 OS가 탑재된 대부분의 스마트폰에서 기본으로 재생지원하고는 있으나, 국내의 음원 다운로드 서비스는 대부분 손실음원이 MP3 방식이라서 대중성이 많이 떨어지는 상황. 간단하게 말해 대부분의 AAC 이용자는 MP3보다 용량대 음질비가 좋다고 알려졌으니까 쓴다. 요즘은 애플에서 256Kbps VBR(MP3 320Kbps를 살짝 상회하는 음질.)을 기본 비트레이트로 삼았는데 음질관련 불만은 사실상 없기 때문에 사용자가 늘어나고는 있다. 다만 애플 관련 제품에서는 사실상 손실음원의 표준으로 자리잡아 반강요되는 포맷이다. 특히 iTunes Store와 여기에 기반한 iTunes Match의 포맷이 AAC이고 아이튠즈의 기본 CD 립핑 옵션이 AAC라서 아이튠즈를 쓰고 있다면 알게 모르게 많이 가지고 있을 것이다. 기본값은 iTunes Plus라고 해서 모노 128 kbps, 스테레오 256 kbps AAC이다.

닌텐도의 경우 닌텐도 DSi와, 닌텐도 DSi LL, Wii에서 SD카드에 넣은 음악을 플레이할 때 사용한다.

블루투스 A2DP 코덱으로도 쓰이고있다. APT-X와 비슷하게 음질이 좋은 편이나 latency는 긴 편이다[3]. AAC파일을 들을때는 bypass도 가능.

AAC는 인코더의 문제가 상당히 큰데, 대충 이런 우열관계가 나온다.

Apple AAC > Fraunhofer FDK Encoder > NeroAACEnc > LAME MP3 > FAAC > FFmpeg[4]
출처1 출처2-1 출처2-2. 포스트 작성 시기가 2011년인 만큼 어디까지나 참고용이다

특히 FFmpeg에 내장된 FAAC 등의 AAC는 오히려 MP3보다 더 성능이 떨어진다. 유튜브나 각종 동영상 제공 업체들이 보통 FFmpeg 기반으로 인코딩해서 서버에 저장하는데, 실제로 이렇게 사용되는 내장 AAC는 LAME MP3보다도 성능이 더 떨어진다. 아 그래서 유튜브에서 나오는 음원의 음질이... 그나마 Nero AAC가 인코더 중 낫다는 평가를 가지고 있었는데, 이마저도 실제 음원을 대상으로 한 테스트에서 LAME MP3보다 좋을 게 없는 안습한 압축률을 보여준 경우가 있었다.[5] 더구나 Nero 인코더는 2012년 이후 아무런 업데이트가 없는 인코더이다.

현재 가장 품질이 좋은 AAC 인코더는 애플의 AAC 인코더이다. OS X아이튠즈, 타임에는 라이브러리처럼 포함되어 있으며, 윈도우에서 이를 공식적으로 쉽게 이용하는 방법은 아이튠즈를 통하는 것이다. 비공식 방법으로 이 라이브러리를 이용하는 툴인 qaac가 있으며, 이를 이용하면 Foobar2000 등에서 AAC를 고퀄로 인코딩할 수 있다. 이것도 최소한 아이튠즈/퀵타임에 내장된 Apple Application Support는 설치해야 하는 것이 조건이다.

3. 오해

애플아이튠즈에서 기본 코덱으로 설정되어 있고, AAC(M4A로 표시되는 경우도 있다.)로 변환하는 인코딩을 지원하기 때문에 AAC는 애플의 자체 코덱이라고 오해하는 사람이 매우 많다. 윗글에도 나와있었지만 MPEG(위원회)과 AT&T 벨 연구소, 프라운호퍼, 돌비 연구소, 소니 등의 기술이 실질적으로 들어갔다. 특히 프라운호퍼의 입김이 가장 강하다. 하지만 입김이 가장 강한 곳에서 만든 AAC보다 아이튠즈 AAC의 압축률이 높다.(...) 뭐 프라운호퍼는 MP3도 LAME에 발렸던 분들이긴 하다
----
  • [1] 디지털 오디오에서 쓰이는 손실 데이터 압축 방식이다. 복잡성이 낮은 고급 오디오 부호화(AAC LC)이며, 스트리밍 오디오와 같은 낮은 비트레이트 애플리케이션에 최적화되었다. 고효율 고급 오디오 부호화 버전1(HE-AAC v1)은 스펙트럼 대역 복제(Spectral band replication, SBR)를 사용하여 주파수 영역(frequency domain)에서 압축 효율을 향상시킨다. 고효율 고급 오디오 부호화 버전2(HE-AAC v2)는 스펙트럼 대역 복제와 파라메트릭 스테레오(PS)가 한 쌍을 이루어 스테레오 신호의 압축 효율을 향상시킨다.
  • [2] 음원 파일에는 오디오 스트림 외에도 헤더 등 다른 정보가 포함되어 있기 때문에 이렇게 용량을 비교하는 것은 큰 의미가 없다. AAC는 CBR이라 하더라도 미약하지만 비트레이트가 가변 할당이기도 하고.
  • [3] 200 ms 내외. AAC 중 latency가 짧은 것은 AAC-LD라고 하며 (20~40 ms), 비트레이트가 낮아 음악 전송용으로 사용하기에는 무리가 있다
  • [4] 영상 쪽 인코더라서 여러 음성코덱을 사용 가능한데, 그 중 자체 코덱을 말한다.
  • [5] 해석에 주의할 것이, 어디까지나 FLAC를 잘 따라가는지가 기준이라는 점을 잊으면 안된다.해당 글을 쓴 사람도 그렇게 말해두고서는 결국 대역폭 기준으로 해석해버렸다.(...)그리고 Opus항목에서 보듯 스펙트럼의 의미는 제한적이다.
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2015-04-09 14:10:36
Processing time 0.1041 sec