SÁCH VÀ BÀI VIẾT MPEG-2 và chỉnh sửa video phi tuyến tính. Chỉ về phức tạp Gần đây, trong giới chuyên gia video, người ta ngày càng nghe thấy nhiều cuộc thảo luận về mã hóa MPEG-2. Sự chú ý đến nó ngày nay đang tăng lên gần như nhanh hơn so với việc mở rộng thực sự phạm vi ứng dụng thực tế của nó. Thật vậy, chúng tôi có quan tâm đến thuật toán nén hiệu quả trong các tác vụ sản xuất video và chỉnh sửa phi tuyến tính không, chúng tôi có đang nghĩ đến việc tạo phim DVD hoặc kho lưu trữ video kỹ thuật số của riêng mình không, chúng tôi có đang phân tích các nguyên tắc của tiêu chuẩn ghi hoặc lưu trữ dữ liệu Betacam SX trên máy chủ video không? và cuối cùng, chúng ta đang thảo luận về các tính năng truyền kỹ thuật số của các chương trình trên truyền hình cáp và vệ tinh, ở mọi nơi chúng ta đều đề cập đến MPEG-2. Từ bảng liệt kê trên, rõ ràng thuật toán này có nhiều mặt, nhiều khía cạnh nên các chuyên gia trong các lĩnh vực khác nhau khi nói về MPEG đôi khi nghĩ về những thứ khác nhau. Nhưng trên thực tế, nó không phức tạp đến mức bạn không thể hiểu được những nguyên tắc cơ bản của nó. Vì vậy, hãy tìm ra nó. Khái niệm cơ bảnHãy để tôi nhắc bạn rằng MPEG là tên viết tắt của Nhóm chuyên gia hình ảnh chuyển động, tên của ủy ban tiêu chuẩn hóa các phương pháp nén kỹ thuật số các luồng dữ liệu video của tổ chức quốc tế ISO/IEC (Tổ chức tiêu chuẩn quốc tế/Ủy ban kỹ thuật điện quốc tế). Ban đầu, nhiệm vụ của ủy ban là phát triển một định dạng để lưu trữ và phát dữ liệu âm thanh/video từ đĩa CD-ROM. Kết quả là, tiêu chuẩn MPEG-1 đã được tạo ra, nhằm vào các kênh truyền thông tin tốc độ thấp (khoảng 1 Mbit/s) và giới hạn ở độ phân giải khung hình 352 x 288 (đối với tín hiệu PAL). Sau đó, khi nhiệm vụ truyền video được mở rộng, dung lượng kênh tăng lên và yêu cầu về chất lượng hình ảnh của hình ảnh thu được cũng tăng lên, MPEG-2, MPEG-4 và thậm chí cả MPEG-7, được tối ưu hóa cho các điều kiện đặc biệt, đã xuất hiện. Do đó, MPEG-4 chủ yếu nhằm mục đích truyền dữ liệu video kỹ thuật số qua đường dây điện thoại (Internet, hội nghị truyền hình) trong điều kiện băng thông bị hạn chế nghiêm trọng (thường là 28,8 Kbps), và do đó làm giảm độ phân giải thêm bốn lần - xuống còn 176 x 144 , nhưng sử dụng sơ đồ mã hóa tiên tiến nhất với việc phân chia hình ảnh thành các đối tượng độc lập như nền, văn bản, đồ họa 2D/3D, khuôn mặt người “biết nói”, cơ thể chuyển động, v.v. Nhưng do sự phức tạp rõ ràng nên tiêu chuẩn này vẫn chưa có. nhận được triển khai thực tế. Đối với MPEG-2, ban đầu nó nhằm mục đích giải quyết vấn đề truyền hình ảnh truyền hình. Mỗi người trong chúng ta đều biết từ kinh nghiệm của mình rằng chất lượng hình ảnh xem trên TV rất khác nhau. Việc xem một bộ phim được phát trên VCR tại nhà hoặc truyền hình cáp địa phương là một chuyện, nhưng việc thưởng thức video từ kênh DVD hoặc vệ tinh lại là một chuyện khác. MPEG-2, như được định nghĩa trong ISO/IEC 13818-2, bao gồm một nhóm các tiêu chuẩn nén truyền hình kỹ thuật số tương thích từ trên xuống được các bên thống nhất. Chính xác hơn, ông cho phép 4 cấp độ (Mức độ) độ phân giải khung hình và 5 hồ sơ cơ bản (Hồ sơ) mã hóa tín hiệu độ chói và sắc độ. Các cấp độ: Thấp LL (Mức thấp) với độ phân giải khung hình 352 x 288 (tương ứng với MPEG-1), chính ML (Mức chính) 720 x 576, cao HL-1440 (Cấp cao) 1440 x 1152 trở lên HL-1920 1920 x x 1152. Lưu ý rằng nếu theo Khuyến nghị ITU-R BT.601 (Liên minh Viễn thông Quốc tế - Khuyến nghị), mức chính xác định độ phân giải của khung hình tivi tiêu chuẩn thì các mức cao tập trung vào truyền hình độ phân giải cao. hồ sơ: đơn giản SP (Hồ sơ đơn giản), cơ bản MP (Cấu hình chính), hai tỷ lệ tín hiệu trên tạp âm có thể mở rộng Hồ sơ có thể mở rộng SNR và được sự cho phép Hồ sơ có thể mở rộng theo không gian và cuối cùng là cao HP (Tầm cỡ). Một vị trí quan trọng cũng bị chiếm giữ bởi cái gọi là chuyên nghiệp chính, hay nói cách khác, hồ sơ MPEG 422, không được thiết lập theo tiêu chuẩn, nhưng được sử dụng tích cực trong thực tế. Nó được chỉ định là 422R. Nếu mọi thứ khá đơn giản với các cấp độ, thì để hiểu được sự khác biệt giữa các cấu hình, cần phải có một số giải thích sơ bộ. Một chút lý thuyết Việc nén thông tin video hiệu quả dựa trên hai ý tưởng chính: loại bỏ các chi tiết nhỏ về phân bố không gian của từng khung hình không quan trọng đối với nhận thức thị giác và loại bỏ sự dư thừa về mặt thời gian trong chuỗi các khung hình này. Do đó có khái niệm nén không gian và thời gian. Đầu tiên trong số chúng sử dụng độ nhạy thấp đã được thiết lập bằng thực nghiệm của nhận thức con người đối với sự biến dạng của các chi tiết hình ảnh nhỏ. Mắt nhận thấy sự không đồng nhất của nền đồng nhất nhanh hơn độ cong của đường viền mỏng hoặc sự thay đổi độ sáng và màu sắc của một vùng nhỏ. Trong toán học, hai cách biểu diễn tương đương của một hình ảnh được biết đến: sự phân bố không gian quen thuộc của độ sáng và màu sắc và cái gọi là phân bố tần số liên quan đến biến đổi cosine rời rạc trong không gian (DCT). Về lý thuyết, chúng tương đương và có thể đảo ngược, nhưng chúng lưu trữ thông tin về cấu trúc của hình ảnh theo những cách hoàn toàn khác nhau: việc truyền các thay đổi mượt mà trong nền được cung cấp bởi các giá trị phân bố tần số thấp (trung tâm) và các hệ số tần số cao chịu trách nhiệm cho các chi tiết nhỏ của sự phân bố không gian. Điều này cho phép sử dụng thuật toán nén sau. Khung được chia thành các khối có kích thước 16 x 16 (kích thước 720 x x 576 tương ứng với các khối 45 x 36), mỗi khối được DCT chuyển đổi thành miền tần số. Sau đó, các hệ số tần số tương ứng sẽ được lượng tử hóa (làm tròn các giá trị tại một khoảng xác định). Nếu bản thân DCT không dẫn đến mất dữ liệu thì việc lượng tử hóa các hệ số chắc chắn sẽ gây ra hiện tượng thô của hình ảnh. Hoạt động lượng tử hóa được thực hiện trong các khoảng thời gian thay đổi - thông tin tần số thấp được truyền đi chính xác nhất, trong khi nhiều hệ số tần số cao có giá trị bằng XNUMX. Điều này cung cấp khả năng nén đáng kể cho luồng dữ liệu, nhưng làm giảm độ phân giải hiệu quả và có thể xuất hiện các chi tiết giả nhỏ (đặc biệt là ở các ranh giới khối). Rõ ràng, lượng tử hóa được sử dụng càng thô thì tỷ lệ nén càng lớn nhưng chất lượng tín hiệu thu được càng thấp. Hãy để tôi nhắc bạn rằng thuật toán này xuất phát từ nhiếp ảnh kỹ thuật số, nơi nó được phát triển dưới tên JPEG để nén hiệu quả các khung hình riêng lẻ (JPEG là tên viết tắt của tên của hiệp hội quốc tế Nhóm chuyên gia chụp ảnh chung đã phê duyệt nó). Sau đó, nó đã được áp dụng thành công cho các chuỗi khung hình video (với mỗi khung hình được xử lý hoàn toàn độc lập) và nhận được tên mới M-JPEG (Motion-JPEG). Cũng cần lưu ý rằng mã hóa DV của các tiêu chuẩn kỹ thuật số DV/DVCAM/DVCPRO về cơ bản dựa trên cùng một thuật toán, nhưng sử dụng sơ đồ linh hoạt hơn với việc lựa chọn bảng lượng tử hóa thích ứng. Không giống như M-JPEG, tỷ lệ nén cho các khối khác nhau thay đổi trên hình ảnh: đối với các khối không có thông tin chi tiết (ví dụ: ở các cạnh của hình ảnh), tỷ lệ nén sẽ tăng và đối với các khối có số lượng lớn chi tiết nhỏ, tỷ lệ nén sẽ giảm so với mức trung bình. cho hình ảnh. Kết quả là, với cùng một chất lượng, khối lượng dữ liệu sẽ giảm khoảng 15% (hoặc ngược lại - với cùng một luồng, chất lượng tín hiệu đầu ra sẽ cao hơn). Nén thời gian MPEG khai thác tính dư thừa cao của thông tin trong các hình ảnh cách nhau một khoảng nhỏ. Thật vậy, giữa các hình ảnh liền kề thường chỉ có một phần nhỏ của cảnh thay đổi - ví dụ, một vật thể nhỏ di chuyển mượt mà trên nền cố định. Trong trường hợp này, thông tin đầy đủ về cảnh chỉ cần được lưu có chọn lọc - để tham khảo hình ảnh. Đối với những người khác, chỉ cần truyền thông tin khác biệt: về vị trí của vật thể, hướng và độ lớn dịch chuyển của nó, các phần tử nền mới (mở ra phía sau vật thể khi nó di chuyển). Hơn nữa, những khác biệt này có thể được hình thành không chỉ so với các hình ảnh trước đó mà còn với các hình ảnh tiếp theo (vì chính trong chúng, khi đối tượng di chuyển, một phần của nền, trước đây bị ẩn đằng sau đối tượng, sẽ lộ ra). Phần tử phức tạp nhất về mặt toán học là tìm kiếm các khối bị dịch chuyển nhưng thay đổi ít về cấu trúc (16 x 16) và xác định các vectơ chuyển vị tương ứng của chúng. Tuy nhiên, yếu tố này là quan trọng nhất vì nó cho phép bạn giảm đáng kể lượng thông tin cần thiết. Hiệu quả của việc thực hiện phần tử “thông minh” này trong thời gian thực giúp phân biệt các bộ mã hóa MPEG khác nhau. Như vậy, trong mã hóa MPEG, về cơ bản, ba loại khung được hình thành: I (Intra) - đóng vai trò là khung tham chiếu và lưu giữ toàn bộ lượng thông tin về cấu trúc của hình ảnh; P (Dự đoán) - mang thông tin về những thay đổi trong cấu trúc của hình ảnh so với khung hình trước đó (loại I hoặc P); B (Hai chiều) - chỉ lưu phần thông tin cần thiết nhất về sự khác biệt so với hình ảnh trước đó và hình ảnh tiếp theo (chỉ I hoặc P). Khái niệm nén tiếp theo các khung I, cũng như các khung P và B khác nhau, tương tự như M-JPEG, nhưng, giống như DV, với sự điều chỉnh thích ứng của các bảng lượng tử hóa. Đặc biệt, điều này cho phép chúng ta mô tả tín hiệu DV là trường hợp đặc biệt của chuỗi khung hình chữ I MPEG với luồng cố định (tỷ lệ nén) nhất định. Các chuỗi khung hình I-, P-, B được kết hợp thành các nhóm khung hình có chiều dài và cấu trúc cố định - GOP (Group of Pictures). Mỗi GOP nhất thiết phải bắt đầu bằng I và chứa các khung P ở những khoảng nhất định. Cấu trúc của nó được mô tả là M/N, trong đó M là tổng số khung trong nhóm và N là khoảng cách giữa các khung P. Như vậy, nhóm 15/3, điển hình cho IPB Video-CD và DVD, có dạng sau: IBBPBBPBBPBBPBB. Ở đây, mỗi khung B được xây dựng lại từ các khung P xung quanh (ở đầu và cuối nhóm - từ I và P), và lần lượt, mỗi khung P được xây dựng lại từ P- (hoặc I-) trước đó. khung. Đồng thời, các khung I có khả năng tự cung cấp và có thể được khôi phục độc lập với các khung khác nhưng là tham chiếu cho tất cả các khung P và đặc biệt là B của nhóm. Do đó, I và P có mức nén thấp nhất, B có mức nén cao nhất. Người ta đã xác định rằng kích thước của khung P điển hình là 1/3 và B - 1/8 của I. Kết quả là, chuỗi MPEG IPPP (GOP 4/1) giúp giảm hai lần luồng dữ liệu cần thiết (với cùng chất lượng) so với chuỗi chỉ khung I và việc sử dụng GOP 15/3 cho phép đạt được bốn lần số lần nén. Cấu hình MPEG-2Bây giờ chúng ta có thể quay lại mô tả các cấu hình khác nhau. Cấu hình SP đơn giản chỉ thực hiện bù và dự đoán chuyển động theo một hướng (khung P). Trong cấu hình chính, dự đoán MP được thực hiện theo hai hướng, tức là cho phép khung B. Trong các cấu hình có thể mở rộng, luồng dữ liệu video kỹ thuật số gốc được chia thành nhiều phần theo các tiêu chí khác nhau. Trong Cấu hình có thể mở rộng SNR, luồng được chia thành hai phần. Tín hiệu đầu tiên trong số đó - tín hiệu chính - mang thông tin có tỷ lệ tín hiệu trên tạp âm giảm (lấy mẫu thô hơn). Nhưng phần này được bảo vệ bằng thuật toán có khả năng chống nhiễu truyền cao hơn (và theo đó, yêu cầu nhiều bit hơn), thu được trong điều kiện nhiễu mạnh và cho phép khôi phục hình ảnh TV ngay cả trong điều kiện không thuận lợi (mặc dù bị giảm tín hiệu). -tỷ lệ tiếng ồn). Phần thứ hai ít được bảo vệ hơn - cái gọi là tín hiệu bổ sung - chỉ bị loại bỏ trong trường hợp thu sóng không ổn định. Với khả năng thu ổn định, nó cho phép bạn bổ sung tín hiệu chính và tăng tỷ lệ tín hiệu trên tạp âm lên giá trị ban đầu. Cấu hình có thể mở rộng theo không gian nâng cao hơn nữa độ phức tạp của sơ đồ mã hóa. Trong đó, luồng sẽ được chia thành ba phần - theo tiêu chí giải quyết. Phần đầu tiên, tín hiệu chính, cung cấp thông tin chống nhiễu về hình ảnh có độ phân giải tiêu chuẩn (625 dòng, trong đó 576 dòng đang hoạt động). Phần thứ hai mở rộng thông tin thành hình ảnh có độ phân giải cao (1250 dòng, 1152 hoạt động). Chà, việc giải mã tín hiệu thứ ba cho phép bạn tăng tỷ lệ tín hiệu trên tạp âm. Cấu hình HP thứ năm - cao nhất - bao gồm tất cả các chức năng của các cấu hình trước đó, nhưng sử dụng biểu diễn YUV không phải 4:2:0 mà là 4:2:2, tức là nó truyền tín hiệu chênh lệch màu sắc thường xuyên gấp đôi (trong mỗi dòng, trong mỗi phần tử dòng). Ở đây một lần nữa cần phải làm rõ một số điều. Được biết, tín hiệu truyền hình là sự kết hợp giữa tín hiệu độ sáng Y và hai tín hiệu chênh lệch màu U và V. Sự thay đổi giá trị của chúng cho phép 256 cấp độ (từ 0 đến 255 đối với Y và từ -128 đến 127 đối với U/V ), trong thuật ngữ nhị phân tương ứng với 8 bit hoặc 1 byte. Về lý thuyết, mỗi phần tử khung có giá trị YUV riêng, tức là yêu cầu 3 byte. Cách biểu diễn này, trong đó cả tín hiệu độ chói và sắc độ đều có số giá trị độc lập bằng nhau, thường được gọi là 4:4:4. Nhưng hệ thống thị giác của con người ít nhạy cảm hơn với những thay đổi về không gian màu sắc so với độ sáng. Và không có bất kỳ sự giảm chất lượng rõ ràng nào, số lượng màu trong mỗi dòng có thể giảm đi một nửa. Cách biểu diễn này, được gọi là 4:2:2, đã được áp dụng trong truyền hình phát sóng. Trong trường hợp này, để truyền toàn bộ giá trị của tín hiệu truyền hình trong mỗi mẫu khung, 2 byte là đủ (xen kẽ các giá trị độc lập U và V qua mẫu). Hơn nữa, đối với mục đích của video dành cho người tiêu dùng, việc giảm một nửa độ phân giải màu dọc, tức là chuyển sang bản trình bày 4:2:0, được coi là có thể chấp nhận được. Điều này làm giảm số byte được báo cáo trên mỗi lần đếm xuống còn 1,5. Lưu ý rằng đây chính xác là khái niệm đã có trong định dạng DV của máy ảnh kỹ thuật số cũng như định dạng video DVD. Tuy nhiên, trong các tác vụ chuyên nghiệp về chỉnh sửa kỹ thuật số và chỉnh sửa video, khi có thể sử dụng nhiều đoạn phim và nhiều lớp và đưa vào đồ họa máy tính, ban đầu cần phải có video kỹ thuật số chất lượng cao hơn để tránh tích tụ lỗi. Vì vậy, cách biểu diễn 4:2:2 được coi là bắt buộc ở đây. Đây là điểm khác biệt giữa hồ sơ 422P với hồ sơ chính. Trong bảng 1 tóm tắt sự khác biệt giữa tất cả các cấu hình được mô tả. Bảng 1
Nén âm thanh Cho đến nay chúng ta chỉ nói về nén hình ảnh. Nhưng một video hoàn chỉnh cũng bao gồm thành phần âm thanh. Âm thanh chất lượng CD được coi là yêu cầu lấy mẫu 44,1 kHz ở 16 bit trên mỗi kênh, tương đương với 706 kbps trên mỗi kênh (1,4 Mbps đối với âm thanh nổi). Chất lượng tín hiệu DAT chỉ định tốc độ lấy mẫu là 48 kHz (dải tần 4-24 Hz) và tăng tốc độ bit lên 000 Kbps trên mỗi kênh. Cách tiếp cận để nén thông tin là như nhau - loại bỏ những phần không có ý nghĩa lắm đối với khả năng nhận biết của tai con người. Tiêu chuẩn MPEG cho phép nén âm thanh ba cấp độ (Lớp). Lớp 768 sử dụng thuật toán đơn giản nhất với độ nén tối thiểu, tức là 1 Kbps trên mỗi kênh. Thuật toán Lớp 192 phức tạp hơn nhưng mức độ nén cao hơn - 2 Kbps trên mỗi kênh. Một thuật toán mạnh mẽ để nén âm thanh kỹ thuật số chất lượng CD (128 lần mà tai người không bị tổn thất), Lớp 11 cung cấp chất lượng âm thanh cao nhất có thể với các hạn chế lưu lượng nghiêm ngặt - không quá 3 Kbps trên mỗi kênh. Nó chủ yếu dành cho Internet. Tầm quan trọng của nó lớn đến mức nó đã nhận được một chữ viết tắt đặc biệt MP64, viết tắt của MPEG Layer 3. Nhiều trang Internet đã xuất hiện chứa hàng trăm nghìn tệp MP3 của các bản nhạc phổ biến. Với sự trợ giúp của các chương trình phát lại đặc biệt (Real Audio), nhạc MP3 có thể được nghe trong thời gian thực qua Internet, có thể sao chép vô thời hạn (lưu ý: một bài hát thông thường chiếm từ 2 đến 8 MB) và phân phối bất hợp pháp. Máy nghe nhạc MP3 di động đã xuất hiện có giá khoảng 200 USD (ví dụ: Diamond Rio). Ngành công nghiệp âm nhạc, chịu tổn thất đáng kể, đã bắt đầu cuộc chiến tích cực chống lại các trang web MP3 (Hiệp hội Công nghiệp Ghi âm Hoa Kỳ đã phát hiện và đóng cửa hầu hết các trang web đó). Nhưng thần đèn đã được thả ra, bạn không thể nhốt tất cả mọi người được. Adaptec dự đoán hàng tỷ bài hát sẽ được tải xuống qua Internet trong những năm tới và cho biết họ sẽ hỗ trợ MP3 trong phiên bản tiếp theo của EasyCD Creator. Tuy nhiên, trong các tác vụ chỉnh sửa kỹ thuật số, việc nén tín hiệu âm thanh không được sử dụng nên khi tính toán luồng cho phép, phải phân bổ tối đa 1,5 Mbit/s cho thành phần âm thanh. MPEG-2 trong các tác vụ chỉnh sửa phi tuyến tínhThuật ngữ “chỉnh sửa phi tuyến tính” không tương ứng với bản chất của quy trình mà chỉ phản ánh một trong những đặc điểm của nó. Trên thực tế, chúng ta đang nói về việc chỉnh sửa video được thực hiện bằng kỹ thuật số trên máy tính. Trong trường hợp này, các đoạn video gốc bắt buộc phải được số hóa và ghi vào ổ cứng dưới dạng tệp thích hợp. Không giống như ổ băng từ, việc truy cập vào bất kỳ tệp phân đoạn nào không yêu cầu tua lại tẻ nhạt (và quá trình này là tuyến tính), tức là tất cả các khung hình video đều có sẵn theo thứ tự ngẫu nhiên. Đặc tính quan trọng này đã dẫn đến việc gọi chỉnh sửa kỹ thuật số là phi tuyến tính, mặc dù rõ ràng là khả năng xử lý kỹ thuật số rộng hơn và phong phú hơn nhiều. Chúng ta hãy nhớ lại rằng theo Khuyến nghị ITU-R BT.601, khung hình truyền hình là ma trận 720 x 576. Khi tính đến tốc độ khung hình truyền hình là 25 Hz, chúng ta đi đến kết luận rằng một giây của video kỹ thuật số có tỷ lệ 4:2. Biểu diễn :2 yêu cầu 20 byte (736 x 000 x 25 x 2), tức là luồng dữ liệu là 720 MB/s. Việc ghi lại các luồng như vậy là khả thi về mặt kỹ thuật, nhưng nó phức tạp, tốn kém và không hiệu quả trong quá trình xử lý hậu kỳ. Trong thực tế, có tính đến các khả năng thực tế, cần phải giảm đáng kể lưu lượng. Có nhiều thuật toán đã biết thực hiện nén mà không làm mất thông tin, nhưng ngay cả thuật toán hiệu quả nhất trong số đó cũng không cung cấp nhiều hơn khả năng nén gấp đôi đối với các hình ảnh thông thường. Cho đến gần đây, M-JPEG vẫn thống trị thế giới hệ thống chỉnh sửa video phi tuyến tính. Các giải pháp khác nhau có mức độ nén khác nhau, tương ứng với các mức chất lượng khác nhau của video thu được. Nói một cách đại khái, có thể phân biệt bốn cấp độ ở đây: video tiêu chuẩn (VHS, C-VHS, Video8), siêu video (SVHS, C-SVHS, Hi8), video kỹ thuật số (Betacam SP, DV/DVCAM/DVCPRO, miniDV, Digital8) và video studio (Digital S, DVCPRO50). Để đơn giản, chúng tôi sẽ ký hiệu thêm chúng là Video, S-Video, DV và Studio-TV. Về mặt định lượng, chúng thường được đặc trưng bởi độ phân giải ngang (số lượng phần tử được phân biệt trong một dòng - dòng truyền hình). Người ta tin rằng Video cung cấp độ phân giải lên tới 280 dòng và tương ứng với luồng M-JPEG khoảng 2 MB/s, S-Video - 400 dòng và 4 MB/s, DV - 500 dòng và 3,1 MB/s, và Studio-TV - độ phân giải ít nhất 600 dòng với tốc độ 7 MB/s. Tỷ lệ nén lần lượt là 10:1, 5:1, 5:1 và 3:1 (hãy nhớ rằng thuật toán DV hiệu quả hơn M-JPEG). Nhưng ngay cả việc nén như vậy cũng cần một lượng dung lượng ổ đĩa đáng kể để lưu trữ và xử lý các tệp video. Ví dụ: một phút video M-JPEG cần 120 MB cho chất lượng Video và khoảng 500 MB cho chất lượng Studio-TV. Nhưng bạn muốn làm việc với những video kéo dài hàng chục phút! Và đây là lúc MPEG-2 xuất hiện. Ngay cả việc chuyển sang khung I cũng cho phép bạn tiết kiệm 15% âm lượng và nếu bạn sử dụng khung P, mức tăng có thể tăng gấp đôi (đối với các nhóm IPPP) và điều này đã rất đáng kể. Đúng, có ý kiến cho rằng trong trường hợp sau, một trong những ưu điểm chính của chỉnh sửa phi tuyến tính sẽ bị mất đi, đó là độ chính xác theo từng khung hình. Đây thực sự là một quan niệm sai lầm. Sử dụng các khung P khác nhau, cấu trúc ban đầu của hình ảnh được khôi phục dễ dàng và nhanh chóng (đối với các bộ xử lý hiện đại, tác vụ như vậy không khó và được thực hiện trong thời gian thực). Về độ chính xác của việc tái tạo, nó giảm đáng kể trong các nhóm dài và/hoặc khi có khung B. Do đó, chẳng hạn, không thể chỉnh sửa DVD-Video (GOP 15/3). Đồng thời, đối với các nhóm ngắn chỉ có khung I và P, quá trình khôi phục diễn ra thực tế mà không có lỗi tích lũy. Do đó, với mã hóa MPEG-2 422P@ML, tốc độ 50 Mbit/s với I-frame (chỉ I-frame) và 25 Mbit/s với nhóm IPPP là đủ để đảm bảo chất lượng phòng thu (xem Bảng 2). Bảng 2
Theo hướng này, các hệ thống chỉnh sửa phi tuyến hiện đại đang phát triển. Cho đến nay có rất ít ví dụ. Đó là FAST 601 [sáu-o-một], Pinnacle miroVideo DC1000 và Matrox DigiSuite DTV. Nhưng ưu điểm của phương pháp này quá rõ ràng nên các giải pháp khác chắc chắn sẽ xuất hiện trong tương lai gần. Tác giả: Andrey Ryakhin, dựa trên tài liệu từ digitalvideo.ru Chúng tôi giới thiệu các bài viết thú vị razdela video nghệ thuật: ▪ Mẹo chiếu sáng cho người vận hành ▪ Học quay video - mẹo dành cho người mới bắt đầu Xem các bài viết khác razdela video nghệ thuật. Đọc và viết hữu ích bình luận về bài viết này. Tin tức khoa học công nghệ, điện tử mới nhất: Sự tồn tại của quy luật entropy cho sự vướng víu lượng tử đã được chứng minh
09.05.2024 Điều hòa mini Sony Reon Pocket 5
09.05.2024 Năng lượng từ không gian cho Starship
08.05.2024
Tin tức thú vị khác: ▪ Máy ảnh siêu mỏng không có ống kính quang học ▪ Sự ra mắt của người điều khiển robot ▪ Thấu kính thủy tinh Chalcogenide Nguồn cấp tin tức khoa học và công nghệ, điện tử mới
Tài liệu thú vị của Thư viện kỹ thuật miễn phí: ▪ phần của trang web Nội dung gián điệp. Lựa chọn bài viết ▪ bài viết Ba mươi lăm nghìn người đưa thư. biểu hiện phổ biến ▪ bài viết Tàu lượn Vympel-9. phương tiện cá nhân ▪ bài viết Bộ xả đá tủ lạnh điện tử. Bách khoa toàn thư về điện tử vô tuyến và kỹ thuật điện
Để lại bình luận của bạn về bài viết này: Tất cả các ngôn ngữ của trang này Trang chủ | Thư viện | bài viết | Sơ đồ trang web | Đánh giá trang web www.diagram.com.ua |