티스토리 뷰

Windows Media 9 시리즈를 이용한 고급 인코딩 기법

디지털 미디어 작업은 과학이 아니라 예술이므로 우수한 결과물을 얻으려면 연습하고 테스트하고 이런 저런 시도를 할 자세가 되어야 합니다. 이 문서에서는 다음과 같은 주제를 설명합니다.
우수한 품질의 콘텐트 캡처 인코딩을 시작하기 전에 가능한 가장 우수한 품질의 콘텐트로 시작할 수 있도록 하기 위해 참고할 수 있는 요령을 설명합니다.

인코딩 기법 우수한 품질의 인코딩된 콘텐트를 얻을 수 있도록 인코딩 작업에 적용할 수 있는 기법들을 설명합니다.

이 문서에서는 가능한 최고의 품질로 인코딩된 콘텐트를 만들기 위해 Microsoft Windows Media Encoder 9 시리즈를 사용하는 경우에 적용할 수 있는 고급 기법에 대한 정보를 제공합니다. 이 문서의 대상은 오디오 및 비디오 전문가를 비롯하여 고품질 인코딩 콘텐트 제작에 관심 있는 모든 사람들입니다. 이 글은 독자들에게 오디오 및 비디오 압축 개념에 관한 일정한 경험이 있음을 전제로 합니다.



우수한 품질의 콘텐트 캡처.

이 섹션은 오디오 및 비디오 콘텐트를 캡처할 때 유의해야 할 사항들을 다루고 있습니다. 아래와 같은 사항들이 이 섹션 전체에 걸쳐 자세히 설명되어 있습니다.
AVI 파일로 캡처링. 최고의 화질과 음질을 얻으려면 캡처 프로세스와 인코딩 프로세스를 결합하지 마십시오. 우선 AVI 파일로 캡처한 다음 인코딩을 수행하십시오.


오디오 및 비디오 소스 비교. 일부 경우 오디오 소스와 비디오 소스의 품질이 서로 다를 수 있습니다. 최고의 품질을 얻으려면 SDI 비디오 및 디지털 오디오를 캡처하십시오.


적절한 오디오 및 비디오 수준 설정. 캡처를 시작하기 전에 오디오 및 비디오 수준을 적절히 설정하십시오.


컴퓨터 최적화. 컴퓨터가 최적화되었는지 확인합니다.


최적 픽셀 형식으로 캡처하기. YUY2 픽셀 형식으로 캡처하면 인코딩 중 색 변환을 방지할 수 있습니다.

최적 해상도 캡처하기. 320x480 또는 640x480의 해상도로 비디오를 캡처하십시오.


AVI 파일로 캡처링
가장 우수한 결과물을 얻으려면 인코딩하기 전에 AVI 파일로 캡처하는 것이 좋습니다. 이는 다음과 같은 점에서 유리합니다.
프로세서가 캡처 프로세스를 따라잡지 못하는 문제를 제거하고 인코더가 모든 계산을 최적화할 수 있도록 해줍니다.


파일의 시작 및 종료 시간 트리밍, 또는 색 보정 등을 수행하기 위한 편집 프로그램을 사용할 수 있도록 해줍니다.


AVI 파일을 소스로 했을 경우 일괄 인코딩을 단순화합니다.
AVI 파일을 캡처링하기 위해 Adobe Premiere, Avid/DS HD 및 VirtualDub 등 여러 프로그램을 사용할 수 있습니다.

AVI 파일로 캡처하면 품질은 더 우수하지만 단점도 몇 가지 있습니다.
캡처 및 인코딩에 추가적인 작업 단계가 필요합니다.
시스템 저장 공간 요구 사항이 더 높습니다.


오디오 및 비디오 소스 비교
가장 우수한 품질의 소스로 작업을 시작하는 것이 중요합니다. 이 섹션에서는 소스를 가장 좋은 것부터 가장 낮은 것까지 나열해 보았습니다.
직렬 디지털 인터페이스(SDI) 비디오. 디지털 비디오 카메라와 캠코더에 사용됩니다. 캡처링 및 인코딩 프로세스가 진행되는 동안 콘텐트는 계속 디지털 형식이 유지되어, 그 결과 데이터 변환 양이 최소가 되므로 가장 높은 화질의 비디오를 얻을 수 있습니다.


컴포넌트 비디오. DVD를 소스로 하는 경우 사용됩니다. 이 소스에서는 비디오 신호가, 예를 들어 RGB 또는 Y/R-y/B-y 형식으로 분리됩니다. 우수한 화질의 비디오를 얻을 수 있습니다.


S-Video. S-VHS, DVD, Hi-8 캠코더 등에 사용됩니다. 이 비디오 신호는 명도와 색도로 분할됩니다. 우수한 화질의 비디오를 얻을 수 있습니다.


DV 비디오. MiniDV 디지털 캠코더와 같은 DV 장치에 사용되며 IEEE 1394 비디오 포트를 통해 연결될 수 있습니다. 우수한 화질의 비디오를 얻을 수 있습니다.


컴포지트 비디오. 아날로그 카메라, 캠코더, 케이블 TV 및 VCR에 사용됩니다. 콤포지트 비디오는 최후 수단으로만 사용해야 합니다. 콤포지트 비디오에서는 명도와 색도 구성 요소가 혼합되므로 좋은 화질을 얻기가 어렵습니다.
오디오: 가능하다면 디지털 오디오를 캡처하십시오. 아날로그 소스로부터 오디오를 캡처할 수 밖에 없다면 균형 잡힌 오디오 연결이 RCA보다 낫습니다.


적절한 오디오 및 비디오 수준 설정
오디오 및 비디오 수준을 적절히 설정하려면
SMPTE 색 막대를 사용하여 비디오 모니터를 조정한 다음, SMPTE 막대의 고해상도 비트맵을 사용하여 컴퓨터 모니터를 조정합니다.


비디오 캡처 카드 수준(색상, 채도, 밝기)을 조정하여 화상을 비디오 모니터에 맞추십시오.


시스템의 모든 오디오 수준을 확인하여 정상화합니다. Echo Layla24 또는 M-Audio Delta Series와 같은 전문가급 오디오 카드를 사용하십시오.


가능하면 디지털 파형 모니터를 사용하십시오.


컴퓨터 최적화
캡처를 시작하기 전에 아래 방법을 통해 컴퓨터를 최적화하십시오.
하드 디스크의 조각 모음을 실시합니다.


네트워크 및 파일 공유 설정을 해제합니다.

다른 프로그램들, 특히 하드 디스크를 액세스하는 프로그램들을 모두 종료합니다.
시스템 리소스를 모니터링하여 컴퓨터가 데이터 입력 속도를 충분히 따라 잡을 수 있는지 확인합니다.


캡처를 진행하는 동안 프레임 누락을 감시합니다. 프레임 누락 없이 전체 영화를 캡처할 수 있어야 합니다.


캡처 카드와 SCSI 카드 사이에 직접 메모리 액세스(DMA) 버퍼 충돌이 없는지 감시합니다. 프레임 누락을 일으킬 수 있습니다. 과거보다는 발생 확률이 줄었습니다. 충돌이 발생한다면 하나의 해결책은 캡처 카드와 SCSI 카드를 서로 다른 버스에 둘 수 있도록 이중 PCI 버스 마더보드를 사용하는 것입니다.


최적 픽셀 형식으로 캡처하기.
인코딩 중에 픽셀 형식 변환을 방지할 수 있는 YUY2(4:2:2) 픽셀 형식으로 캡처하는 것이 좋습니다. Windows Media Video 9 시리즈 코덱은 주로 4:2:0 픽셀 형식으로 되어 있으나 콘텐트에서 인터레이싱을 유지하는 경우(Windows Media Encoder 9 시리즈의 새로운 기능)에는 4:1:1 픽셀 형식이 사용됩니다. YUY2 형식은 4:2:0 및 4:1:1 픽셀 형식의 상위 집합이므로 콘텐트는 데이터 손실 없이 두 형식 중 하나로 변환될 수 있습니다.

중요한 것은 4:2:0 AVI 파일로 캡처하면(예를 들어 I420, YV12, 또는 IYUV), 소스 비디오에서 인터레이싱을 유지할 수 없다는 점입니다.

구형 캡처 장치는 공시된 규격에 완전히 따르지 않는 AVI 파일을 만들 수 있으므로 위 아래가 바뀐 YUY2 픽셀 형식이 나올 수 있습니다. 이를 방지하려면 다른 픽셀 형식을 사용하도록 캡처 장치에 해당 드라이버를 설정하거나, 사용하고 있는 드라이버가 ''뒤집기'' 기능을 제공하는 경우에는 이미지를 뒤집기하면 됩니다. 또한 인코더에서 영상을 뒤집기할 수 있는 옵션도 있습니다.

RGB 픽셀 형식을 권장하지 않는 이유는 색상-공간 변환이 불필요하게 많고, 파일이 더 크고, 더 많은 데이터가 버스를 통해 이동하기 때문입니다.



최적 해상도 캡처하기.
320240 해상도로 AVI 파일에 캡처하면 캡처 카드가 필드 중 하나를 제거하여 효과적으로 비디오를 디인터레이스합니다. 대상 시청자가 비디오를 320240으로 재생한다면 대개 용인할 만한 결과를 얻을 수 있습니다. 그러나 최고의 화질을 보장하려면, Microsoft Windows Media Encoder를 사용하여 비디오를 디인터레이스하거나 역 텔레시네 기능을 적용할 수 있도록 두 필드를 모두 캡처해야 합니다. 디인터레이싱과 역 텔레시네가 올바르게 작동하려면 프레임에 두 필드가 모두 있어야 합니다. 따라서 320480 또는 640480으로 캡처하는 것이 좋습니다. 디인터레이싱 또는 역 텔레시네 필터가 인코더에 적용되고 나면 인코딩된 비디오는 320240이 됩니다.




인코딩 기법.

소스를 캡처했으면 인코딩 세션을 설정할 준비가 된 것입니다. 이 섹션에서는 우수한 품질의 인코딩된 콘텐트를 얻을 수 있도록 인코딩 세션에 적용할 수 있는 기법들을 설명합니다.
비디오 최적화
비정방형 픽셀 출력 유지
인코딩 모드 선택
압축 설정


비디오 최적화
인코더를 사용하여 인터레이스된 소스 비디오를 디인터레이스하거나 텔레시네 처리된 콘텐트에 역 텔레시네 필터를 적용하거나 소스 비디오의 인터레이싱을 유지할 수 있습니다. 선택할 수 있는 옵션은 아래와 같이 비디오의 소스에 따라 다릅니다.
필름 콘텐트 표준 동영상 필름은 초 당 24프레임(fps)으로 촬영됩니다. 이 필름이 텔레비전에서 방송되려면 비디오 테이프로 변환되어 텔레시네 프로세스를 거쳐야 하는데 이 프로세스에서는 NTSC 표준에서 요구하는 29.97fps로 변환해 주는 프레임이 추가됩니다. 텔레시네 프로세스 중에 추가된 불필요한 프레임을 제거하려면 역 텔레시네 필터를 적용하는 것이 좋습니다. 그러면 중복되는 데이터가 제거되고 인코딩된 비디오의 화질이 개선됩니다.


비디오 콘텐트 대상으로 하고 있는 재생 장치에 따라 소스 비디오의 인터레이싱을 유지하거나 디인터레이스하는 것이 좋습니다. 컴퓨터와 같은 프로그레시브 스캔 장치에서 재생하려면 디인터레이스를 수행하고 텔레비전 같은 인터레이스 장치에서 재생하려면 인터레이싱을 유지하는 것이 좋습니다. 비디오를 디인터레이싱하는 경우에는, Windows Media Player 9 시리즈가 컴퓨터의 그래픽 카드가 재생 중에 하드웨어 디인터레이싱을 지원하는지 여부를 감지할 수 있습니다. 지원하는 경우, 코덱은 디인터레이싱을 위해 모든 정보를 그래픽 카드로 넘겨 줍니다. 그래픽 카드가 하드웨어 디인터레이싱을 지원하지 않는 경우에는 코덱이 디인터레이싱을 처리합니다.


필름과 비디오가 혼합된 콘텐트 소스 비디오가 640480 및 30fps라면 디인터레이싱을 권장합니다. 인코딩된 비디오에는 여전히 텔레시네된 프레임이 남아 있지만 인터레이싱 가공물은 제거됩니다. 그렇지 않을 경우에는, 인터레이싱을 유지할 수 있습니다.


비정방형 픽셀 출력 유지
비디오 소스에 비정방형 픽셀이 있다면 인코더를 사용하여 픽셀 가로 세로 비율을 유지할 수 있습니다. 픽셀 가로 세로 비율은 픽셀의 폭(x)와 높이(y)의 비율을 말합니다. 정방형 픽셀의 비율은 1:1이지만 비정방형(직사각형) 픽셀의 폭과 높이는 서로 다릅니다. 이 개념은 이미지 전체 폭과 높이의 비율을 지칭하는 프레임 가로 세로 비율과 유사합니다. 그러나 이 비율들이 서로 반드시 관련되는 것은 아닙니다. 예를 들어, 16:9의 프레임 비율을 가진 와이드스크린 이미지는 정방형 픽셀로도 구성될 수 있고 비정방형 픽셀로도 구성될 수 있습니다.

비정방형 픽셀로 구성된 비디오 소스를 정방형 픽셀로 구성된 것처럼 인코딩하면 출력에 왜곡 현상이 발생합니다.

출력 비디오의 크기를 소스 비디오의 크기와 같게 설정했고, 소스 비디오의 픽셀이 비정방형이라면 소스 비디오의 가로 세로 픽셀 비율이 출력 비디오에서도 자동으로 유지됩니다. Windows Media Player 9 시리즈는 재생 중에 자동으로 비디오를 해석하여 크기를 적절히 조정합니다.



인코딩 모드 선택
Windows Media Encoder를 사용하면 오디오 및 비디오 콘텐트를 고정 비트 전송률(CBR) 또는 가변 비트 전송률(VBR)로 인코딩할 수 있습니다. 사용할 모드는 소스 및 목표로 하는 시나리오에 따라 다릅니다.
1패스 CBR. 라이브 콘텐트를 캡처하거나 브로드캐스팅하거나 구형 플레이어 또는 장치를 대상으로 하는 경우에 사용합니다.


2패스 CBR. 파일에서 캡처하거나 파일로 인코딩하거나 on-demand 스트리밍 시나리오를 설정하려는 경우에 사용합니다.


품질 기반 VBR(1패스). 예를 들어 콘텐트를 보관하는 경우처럼 일정한 품질 수준을 유지하려는 경우에 사용합니다. 품질 기반 VBR은 품질을 유지하기 위해 비트 전송률을 임의적으로 스파이크하여, 처음부터 끝까지 일관된 품질을 유지합니다.


비트 전송률 기반 VBR(2패스). 예측 가능한 평균 대역폭을 유지하면서 최고 화질 수준을 달성하려는 경우에 사용합니다. 재생되기 전에 다운로드할 수 있는 파일을 만들려는 경우, 또는 출력 파일의 크기를 제어하려는 경우에 이 모드를 사용합니다.


최고 비트 전송률 기반 VBR(2패스). CD 또는 DVD 플레이어와 같이 읽기 속도가 제한된 장치에서 재생되는 콘텐트를 만들려는 경우에 사용합니다. 비트 전송률 기반 VBR 인코딩과 유사하지만 최고 비트 전송률을 지정해야 합니다.
1 패스 인코딩을 사용하면 콘텐트는 인코더를 한 번 패스하며 압축은 콘텐트가 발생했을 때 적용됩니다. 2 패스 인코딩을 사용하면 콘텐트는 첫 번째 패스 동안 분석된 다음 첫 번째 패스에서 수집된 데이터에 근거하여 두 번째 패스에서 인코딩됩니다.

2 패스 인코딩을 사용하면 인코더가 버퍼에 의해 지정된 창 안에 비트를 보다 효율적으로 할당할 수 있으므로 더 나은 품질의 콘텐트를 얻을 수 있습니다. 그러나 인코더가 콘텐트 전체를 두 번 처리해야 하기 때문에 2 패스 인코딩은 더 오래 걸립니다. 2 패스 인코딩을 모든 경우에 사용할 수는 없으며 라이브 이벤트를 방송하는 경우에는 사용할 수 없습니다.



압축 설정
이 섹션에서는 중요한 압축 설정 몇 가지를, 그 서로 간의 장단점 비교와 함께 설명합니다.
키 프레임. 키 프레임이란 인코딩된 비디오에서 변경된 것이 아닌 전체 프레임의 데이터가 전송되는 지점을 말합니다. 키 프레임은 일반적으로 장면 변화가 있는 경우에 삽입되며, 탐색 기능 개선을 위해 일정한 간격으로 삽입되기도 합니다. 키 프레임 설정이란 인코더가 키 프레임을 삽입하는 지점들 사이의 최단 시간을 말합니다.(필요한 경우 자동으로 더 자주 삽입됩니다.) 키 프레임 사이의 거리를 좁히면 비디오의 화질이 개선되지만 전체적인 파일 크기에도 상당한 영향을 줍니다. 인코딩된 비디오를 편집할 때 편집 화질을 향상시키려면 키 프레임 사이의 거리를 줄이십시오. 파일 크기를 최소화하려면 키 프레임 값을, 예를 들어 20초 정도로 늘려 잡으십시오. 키 프레임 거리를 길게 설정하면 필요한 경우, 예를 들어 장면 전환이 있는 경우, 추가 키 프레임이 삽입됩니다. 키 프레임 거리를 길게 잡으면 비디오 탐색 능력, 그리고 멀티캐스트 시나리오에서 사용자가 비디오를 기다리는 데 필요한 시간에 영향을 준다는 점을 기억하십시오.


버퍼 크기. 비트 전송률과 콘텐트의 품질은 버퍼 크기의 제약 안에서 변동됩니다. 버퍼 크기가 크면 버퍼 범위 내에서 더 많은 비트를 복잡한 장면에 할당할 수 있습니다. 예를 들어, 버퍼 크기를 10초로 잡은 경우, 코덱은 바이트의 x 숫자를 앞의 8초에 할당하고 뒤 2초에 나머지를 할당할 것입니다. 이렇게 하면 버퍼 내에서 더 많은 비트를 비디오의 더 복잡한 부분에 할당할 수 있습니다. 일반적으로 버퍼 크기를 늘리면 품질도 개선됩니다. 그러나 사용자가 콘텐트를 요청한 시각과 재생이 시작되는 시가 사이의 지연 시간이 늘어납니다. 다운로드 앤 플레이 시나리오에서는 버퍼 크기를 늘려도 이 지연 시간에는 거의 영향이 없습니다. 비트 전송률이 낮은 경우에는 버퍼 크기를 늘리는 것이 좋습니다. 비트 전송률이 높은 경우에는 버퍼 크기를 늘려도 화질에는 큰 차이가 없습니다.


영상의 부드러움. 비디오의 부드러운 정도는 선명한 이미지와 부드러운 동작 사이의 역관계를 결정합니다. 대상이 화면의 한 곳에서 다른 곳으로 쉽게 이동하고 대상의 가장 자리가 고르지 않으면 비디오는 부드럽게 보입니다. 이미지와 동작이 잘 정의되어 선 처리가 말끔하게 이루어지면 비디오는 더 선명하게 보입니다. 비트 전송률 설정은 비디오의 일정 기간에 대해 할당되는 비트 수를 결정합니다. 이 설정에 근거하여 코덱은 더 많은 프레임을 포함하도록 선택할 수 있으며 그 결과, 프레임이 더 많아지기 때문에 이미지도 더 부드럽게 표현됩니다. 그러나 각 프레임에 할당되는 비트 수는 줄어듭니다. 비디오의 부드러운 정도를 설정하는 값을 올리면 코덱에 들어가는 프레임 수는 줄어듭니다. 이렇게 하면 프레임에 할당되는 비트 수가 늘어나 이미지가 선명해지지만 프레임 수가 적으므로 이미지가 부드럽게 표현되지 않습니다. 비디오의 부드러운 정도 설정은 지정된 프레임 비율에서 인코딩할 비트 수가 충분하지 않을 때에만 효과가 있으며 선명도가 줄어드는 것은 감수해야 합니다. 비트 전송률이 높으면 이 값을 더 올려도 됩니다. 인코딩 중에 프레임 누락이 있다면 비디오의 부드러운 정도를 줄이는 것을 고려해 보십시오.

출처-http://www.jedcast.net