MPEG-2 và chỉnh sửa video phi tuyến tính. Chỉ về khu phức hợp. video nghệ thuật

SÁCH VÀ BÀI VIẾT
Thư viện miễn phí / Cẩm nang / video nghệ thuật

MPEG-2 và chỉnh sửa video phi tuyến tính. Chỉ về phức tạp

video nghệ thuật

Gần đây, trong giới chuyên gia video, người ta ngày càng nghe thấy nhiều cuộc thảo luận về mã hóa MPEG-2. Sự chú ý đến nó ngày nay đang tăng lên gần như nhanh hơn so với việc mở rộng thực sự phạm vi ứng dụng thực tế của nó. Thật vậy, chúng tôi có quan tâm đến thuật toán nén hiệu quả trong các tác vụ sản xuất video và chỉnh sửa phi tuyến tính không, chúng tôi có đang nghĩ đến việc tạo phim DVD hoặc kho lưu trữ video kỹ thuật số của riêng mình không, chúng tôi có đang phân tích các nguyên tắc của tiêu chuẩn ghi hoặc lưu trữ dữ liệu Betacam SX trên máy chủ video không? và cuối cùng, chúng ta đang thảo luận về các tính năng truyền kỹ thuật số của các chương trình trên truyền hình cáp và vệ tinh, ở mọi nơi chúng ta đều đề cập đến MPEG-2. Từ bảng liệt kê trên, rõ ràng thuật toán này có nhiều mặt, nhiều khía cạnh nên các chuyên gia trong các lĩnh vực khác nhau khi nói về MPEG đôi khi nghĩ về những thứ khác nhau. Nhưng trên thực tế, nó không phức tạp đến mức bạn không thể hiểu được những nguyên tắc cơ bản của nó. Vì vậy, hãy tìm ra nó.

Khái niệm cơ bản

Hãy để tôi nhắc bạn rằng MPEG là tên viết tắt của Nhóm chuyên gia hình ảnh chuyển động, tên của ủy ban tiêu chuẩn hóa các phương pháp nén kỹ thuật số các luồng dữ liệu video của tổ chức quốc tế ISO/IEC (Tổ chức tiêu chuẩn quốc tế/Ủy ban kỹ thuật điện quốc tế). Ban đầu, nhiệm vụ của ủy ban là phát triển một định dạng để lưu trữ và phát dữ liệu âm thanh/video từ đĩa CD-ROM. Kết quả là, tiêu chuẩn MPEG-1 đã được tạo ra, nhằm vào các kênh truyền thông tin tốc độ thấp (khoảng 1 Mbit/s) và giới hạn ở độ phân giải khung hình 352 x 288 (đối với tín hiệu PAL). Sau đó, khi nhiệm vụ truyền video được mở rộng, dung lượng kênh tăng lên và yêu cầu về chất lượng hình ảnh của hình ảnh thu được cũng tăng lên, MPEG-2, MPEG-4 và thậm chí cả MPEG-7, được tối ưu hóa cho các điều kiện đặc biệt, đã xuất hiện.

Do đó, MPEG-4 chủ yếu nhằm mục đích truyền dữ liệu video kỹ thuật số qua đường dây điện thoại (Internet, hội nghị truyền hình) trong điều kiện băng thông bị hạn chế nghiêm trọng (thường là 28,8 Kbps), và do đó làm giảm độ phân giải thêm bốn lần - xuống còn 176 x 144 , nhưng sử dụng sơ đồ mã hóa tiên tiến nhất với việc phân chia hình ảnh thành các đối tượng độc lập như nền, văn bản, đồ họa 2D/3D, khuôn mặt người “biết nói”, cơ thể chuyển động, v.v. Nhưng do sự phức tạp rõ ràng nên tiêu chuẩn này vẫn chưa có. nhận được triển khai thực tế.

Đối với MPEG-2, ban đầu nó nhằm mục đích giải quyết vấn đề truyền hình ảnh truyền hình. Mỗi người trong chúng ta đều biết từ kinh nghiệm của mình rằng chất lượng hình ảnh xem trên TV rất khác nhau. Việc xem một bộ phim được phát trên VCR tại nhà hoặc truyền hình cáp địa phương là một chuyện, nhưng việc thưởng thức video từ kênh DVD hoặc vệ tinh lại là một chuyện khác. MPEG-2, như được định nghĩa trong ISO/IEC 13818-2, bao gồm một nhóm các tiêu chuẩn nén truyền hình kỹ thuật số tương thích từ trên xuống được các bên thống nhất. Chính xác hơn, ông cho phép 4 cấp độ (Mức độ) độ phân giải khung hình và 5 hồ sơ cơ bản (Hồ sơ) mã hóa tín hiệu độ chói và sắc độ.

Các cấp độ: Thấp LL (Mức thấp) với độ phân giải khung hình 352 x 288 (tương ứng với MPEG-1), chính ML (Mức chính) 720 x 576, cao HL-1440 (Cấp cao) 1440 x 1152 trở lên HL-1920 1920 x x 1152. Lưu ý rằng nếu theo Khuyến nghị ITU-R BT.601 (Liên minh Viễn thông Quốc tế - Khuyến nghị), mức chính xác định độ phân giải của khung hình tivi tiêu chuẩn thì các mức cao tập trung vào truyền hình độ phân giải cao.

hồ sơ: đơn giản SP (Hồ sơ đơn giản), cơ bản MP (Cấu hình chính), hai tỷ lệ tín hiệu trên tạp âm có thể mở rộng Hồ sơ có thể mở rộng SNR và được sự cho phép Hồ sơ có thể mở rộng theo không gian và cuối cùng là cao HP (Tầm cỡ). Một vị trí quan trọng cũng bị chiếm giữ bởi cái gọi là chuyên nghiệp chính, hay nói cách khác, hồ sơ MPEG 422, không được thiết lập theo tiêu chuẩn, nhưng được sử dụng tích cực trong thực tế. Nó được chỉ định là 422R. Nếu mọi thứ khá đơn giản với các cấp độ, thì để hiểu được sự khác biệt giữa các cấu hình, cần phải có một số giải thích sơ bộ.

Một chút lý thuyết

Việc nén thông tin video hiệu quả dựa trên hai ý tưởng chính: loại bỏ các chi tiết nhỏ về phân bố không gian của từng khung hình không quan trọng đối với nhận thức thị giác và loại bỏ sự dư thừa về mặt thời gian trong chuỗi các khung hình này. Do đó có khái niệm nén không gian và thời gian.

Đầu tiên trong số chúng sử dụng độ nhạy thấp đã được thiết lập bằng thực nghiệm của nhận thức con người đối với sự biến dạng của các chi tiết hình ảnh nhỏ. Mắt nhận thấy sự không đồng nhất của nền đồng nhất nhanh hơn độ cong của đường viền mỏng hoặc sự thay đổi độ sáng và màu sắc của một vùng nhỏ. Trong toán học, hai cách biểu diễn tương đương của một hình ảnh được biết đến: sự phân bố không gian quen thuộc của độ sáng và màu sắc và cái gọi là phân bố tần số liên quan đến biến đổi cosine rời rạc trong không gian (DCT). Về lý thuyết, chúng tương đương và có thể đảo ngược, nhưng chúng lưu trữ thông tin về cấu trúc của hình ảnh theo những cách hoàn toàn khác nhau: việc truyền các thay đổi mượt mà trong nền được cung cấp bởi các giá trị phân bố tần số thấp (trung tâm) và các hệ số tần số cao chịu trách nhiệm cho các chi tiết nhỏ của sự phân bố không gian.

Điều này cho phép sử dụng thuật toán nén sau. Khung được chia thành các khối có kích thước 16 x 16 (kích thước 720 x x 576 tương ứng với các khối 45 x 36), mỗi khối được DCT chuyển đổi thành miền tần số. Sau đó, các hệ số tần số tương ứng sẽ được lượng tử hóa (làm tròn các giá trị tại một khoảng xác định). Nếu bản thân DCT không dẫn đến mất dữ liệu thì việc lượng tử hóa các hệ số chắc chắn sẽ gây ra hiện tượng thô của hình ảnh. Hoạt động lượng tử hóa được thực hiện trong các khoảng thời gian thay đổi - thông tin tần số thấp được truyền đi chính xác nhất, trong khi nhiều hệ số tần số cao có giá trị bằng XNUMX. Điều này cung cấp khả năng nén đáng kể cho luồng dữ liệu, nhưng làm giảm độ phân giải hiệu quả và có thể xuất hiện các chi tiết giả nhỏ (đặc biệt là ở các ranh giới khối). Rõ ràng, lượng tử hóa được sử dụng càng thô thì tỷ lệ nén càng lớn nhưng chất lượng tín hiệu thu được càng thấp.

Hãy để tôi nhắc bạn rằng thuật toán này xuất phát từ nhiếp ảnh kỹ thuật số, nơi nó được phát triển dưới tên JPEG để nén hiệu quả các khung hình riêng lẻ (JPEG là tên viết tắt của tên của hiệp hội quốc tế Nhóm chuyên gia chụp ảnh chung đã phê duyệt nó). Sau đó, nó đã được áp dụng thành công cho các chuỗi khung hình video (với mỗi khung hình được xử lý hoàn toàn độc lập) và nhận được tên mới M-JPEG (Motion-JPEG). Cũng cần lưu ý rằng mã hóa DV của các tiêu chuẩn kỹ thuật số DV/DVCAM/DVCPRO về cơ bản dựa trên cùng một thuật toán, nhưng sử dụng sơ đồ linh hoạt hơn với việc lựa chọn bảng lượng tử hóa thích ứng. Không giống như M-JPEG, tỷ lệ nén cho các khối khác nhau thay đổi trên hình ảnh: đối với các khối không có thông tin chi tiết (ví dụ: ở các cạnh của hình ảnh), tỷ lệ nén sẽ tăng và đối với các khối có số lượng lớn chi tiết nhỏ, tỷ lệ nén sẽ giảm so với mức trung bình. cho hình ảnh. Kết quả là, với cùng một chất lượng, khối lượng dữ liệu sẽ giảm khoảng 15% (hoặc ngược lại - với cùng một luồng, chất lượng tín hiệu đầu ra sẽ cao hơn).

Nén thời gian MPEG khai thác tính dư thừa cao của thông tin trong các hình ảnh cách nhau một khoảng nhỏ. Thật vậy, giữa các hình ảnh liền kề thường chỉ có một phần nhỏ của cảnh thay đổi - ví dụ, một vật thể nhỏ di chuyển mượt mà trên nền cố định. Trong trường hợp này, thông tin đầy đủ về cảnh chỉ cần được lưu có chọn lọc - để tham khảo hình ảnh. Đối với những người khác, chỉ cần truyền thông tin khác biệt: về vị trí của vật thể, hướng và độ lớn dịch chuyển của nó, các phần tử nền mới (mở ra phía sau vật thể khi nó di chuyển). Hơn nữa, những khác biệt này có thể được hình thành không chỉ so với các hình ảnh trước đó mà còn với các hình ảnh tiếp theo (vì chính trong chúng, khi đối tượng di chuyển, một phần của nền, trước đây bị ẩn đằng sau đối tượng, sẽ lộ ra). Phần tử phức tạp nhất về mặt toán học là tìm kiếm các khối bị dịch chuyển nhưng thay đổi ít về cấu trúc (16 x 16) và xác định các vectơ chuyển vị tương ứng của chúng. Tuy nhiên, yếu tố này là quan trọng nhất vì nó cho phép bạn giảm đáng kể lượng thông tin cần thiết. Hiệu quả của việc thực hiện phần tử “thông minh” này trong thời gian thực giúp phân biệt các bộ mã hóa MPEG khác nhau.

Như vậy, trong mã hóa MPEG, về cơ bản, ba loại khung được hình thành: I (Intra) - đóng vai trò là khung tham chiếu và lưu giữ toàn bộ lượng thông tin về cấu trúc của hình ảnh; P (Dự đoán) - mang thông tin về những thay đổi trong cấu trúc của hình ảnh so với khung hình trước đó (loại I hoặc P); B (Hai chiều) - chỉ lưu phần thông tin cần thiết nhất về sự khác biệt so với hình ảnh trước đó và hình ảnh tiếp theo (chỉ I hoặc P). Khái niệm nén tiếp theo các khung I, cũng như các khung P và B khác nhau, tương tự như M-JPEG, nhưng, giống như DV, với sự điều chỉnh thích ứng của các bảng lượng tử hóa. Đặc biệt, điều này cho phép chúng ta mô tả tín hiệu DV là trường hợp đặc biệt của chuỗi khung hình chữ I MPEG với luồng cố định (tỷ lệ nén) nhất định. Các chuỗi khung hình I-, P-, B được kết hợp thành các nhóm khung hình có chiều dài và cấu trúc cố định - GOP (Group of Pictures). Mỗi GOP nhất thiết phải bắt đầu bằng I và chứa các khung P ở những khoảng nhất định. Cấu trúc của nó được mô tả là M/N, trong đó M là tổng số khung trong nhóm và N là khoảng cách giữa các khung P. Như vậy, nhóm 15/3, điển hình cho IPB Video-CD và DVD, có dạng sau: IBBPBBPBBPBBPBB. Ở đây, mỗi khung B được xây dựng lại từ các khung P xung quanh (ở đầu và cuối nhóm - từ I và P), và lần lượt, mỗi khung P được xây dựng lại từ P- (hoặc I-) trước đó. khung. Đồng thời, các khung I có khả năng tự cung cấp và có thể được khôi phục độc lập với các khung khác nhưng là tham chiếu cho tất cả các khung P và đặc biệt là B của nhóm. Do đó, I và P có mức nén thấp nhất, B có mức nén cao nhất. Người ta đã xác định rằng kích thước của khung P điển hình là 1/3 và B - 1/8 của I.

Kết quả là, chuỗi MPEG IPPP (GOP 4/1) giúp giảm hai lần luồng dữ liệu cần thiết (với cùng chất lượng) so với chuỗi chỉ khung I và việc sử dụng GOP 15/3 cho phép đạt được bốn lần số lần nén.

Cấu hình MPEG-2

Bây giờ chúng ta có thể quay lại mô tả các cấu hình khác nhau. Cấu hình SP đơn giản chỉ thực hiện bù và dự đoán chuyển động theo một hướng (khung P). Trong cấu hình chính, dự đoán MP được thực hiện theo hai hướng, tức là cho phép khung B. Trong các cấu hình có thể mở rộng, luồng dữ liệu video kỹ thuật số gốc được chia thành nhiều phần theo các tiêu chí khác nhau. Trong Cấu hình có thể mở rộng SNR, luồng được chia thành hai phần. Tín hiệu đầu tiên trong số đó - tín hiệu chính - mang thông tin có tỷ lệ tín hiệu trên tạp âm giảm (lấy mẫu thô hơn). Nhưng phần này được bảo vệ bằng thuật toán có khả năng chống nhiễu truyền cao hơn (và theo đó, yêu cầu nhiều bit hơn), thu được trong điều kiện nhiễu mạnh và cho phép khôi phục hình ảnh TV ngay cả trong điều kiện không thuận lợi (mặc dù bị giảm tín hiệu). -tỷ lệ tiếng ồn). Phần thứ hai ít được bảo vệ hơn - cái gọi là tín hiệu bổ sung - chỉ bị loại bỏ trong trường hợp thu sóng không ổn định. Với khả năng thu ổn định, nó cho phép bạn bổ sung tín hiệu chính và tăng tỷ lệ tín hiệu trên tạp âm lên giá trị ban đầu.

Cấu hình có thể mở rộng theo không gian nâng cao hơn nữa độ phức tạp của sơ đồ mã hóa. Trong đó, luồng sẽ được chia thành ba phần - theo tiêu chí giải quyết. Phần đầu tiên, tín hiệu chính, cung cấp thông tin chống nhiễu về hình ảnh có độ phân giải tiêu chuẩn (625 dòng, trong đó 576 dòng đang hoạt động). Phần thứ hai mở rộng thông tin thành hình ảnh có độ phân giải cao (1250 dòng, 1152 hoạt động). Chà, việc giải mã tín hiệu thứ ba cho phép bạn tăng tỷ lệ tín hiệu trên tạp âm.

Cấu hình HP thứ năm - cao nhất - bao gồm tất cả các chức năng của các cấu hình trước đó, nhưng sử dụng biểu diễn YUV không phải 4:2:0 mà là 4:2:2, tức là nó truyền tín hiệu chênh lệch màu sắc thường xuyên gấp đôi (trong mỗi dòng, trong mỗi phần tử dòng).

Ở đây một lần nữa cần phải làm rõ một số điều. Được biết, tín hiệu truyền hình là sự kết hợp giữa tín hiệu độ sáng Y và hai tín hiệu chênh lệch màu U và V. Sự thay đổi giá trị của chúng cho phép 256 cấp độ (từ 0 đến 255 đối với Y và từ -128 đến 127 đối với U/V ), trong thuật ngữ nhị phân tương ứng với 8 bit hoặc 1 byte. Về lý thuyết, mỗi phần tử khung có giá trị YUV riêng, tức là yêu cầu 3 byte. Cách biểu diễn này, trong đó cả tín hiệu độ chói và sắc độ đều có số giá trị độc lập bằng nhau, thường được gọi là 4:4:4. Nhưng hệ thống thị giác của con người ít nhạy cảm hơn với những thay đổi về không gian màu sắc so với độ sáng. Và không có bất kỳ sự giảm chất lượng rõ ràng nào, số lượng màu trong mỗi dòng có thể giảm đi một nửa. Cách biểu diễn này, được gọi là 4:2:2, đã được áp dụng trong truyền hình phát sóng. Trong trường hợp này, để truyền toàn bộ giá trị của tín hiệu truyền hình trong mỗi mẫu khung, 2 byte là đủ (xen kẽ các giá trị độc lập U và V qua mẫu). Hơn nữa, đối với mục đích của video dành cho người tiêu dùng, việc giảm một nửa độ phân giải màu dọc, tức là chuyển sang bản trình bày 4:2:0, được coi là có thể chấp nhận được. Điều này làm giảm số byte được báo cáo trên mỗi lần đếm xuống còn 1,5. Lưu ý rằng đây chính xác là khái niệm đã có trong định dạng DV của máy ảnh kỹ thuật số cũng như định dạng video DVD.

Tuy nhiên, trong các tác vụ chuyên nghiệp về chỉnh sửa kỹ thuật số và chỉnh sửa video, khi có thể sử dụng nhiều đoạn phim và nhiều lớp và đưa vào đồ họa máy tính, ban đầu cần phải có video kỹ thuật số chất lượng cao hơn để tránh tích tụ lỗi. Vì vậy, cách biểu diễn 4:2:2 được coi là bắt buộc ở đây. Đây là điểm khác biệt giữa hồ sơ 422P với hồ sơ chính. Trong bảng 1 tóm tắt sự khác biệt giữa tất cả các cấu hình được mô tả.

Bảng 1

Chức năng /	Đơn giản	Chính	422P	Tỉ lệ	Không gian	Cao
Hồ Sơ	(SP)	(MP)		được kiểm soát	có thể mở rộng	(HP)
khung chữ I	-	-	-	-	-	-
Khung chữ P	-	-	-	-	-	-
khung B		-	-	-	-	-
Tách SNR				-	-	-
Tách bằng độ phân giải					-	-
Đại diện YUV	4:2:0	4:2:0	4:2:2	4:2:0	4:2:0	4:2:2

Nén âm thanh

Cho đến nay chúng ta chỉ nói về nén hình ảnh. Nhưng một video hoàn chỉnh cũng bao gồm thành phần âm thanh. Âm thanh chất lượng CD được coi là yêu cầu lấy mẫu 44,1 kHz ở 16 bit trên mỗi kênh, tương đương với 706 kbps trên mỗi kênh (1,4 Mbps đối với âm thanh nổi). Chất lượng tín hiệu DAT chỉ định tốc độ lấy mẫu là 48 kHz (dải tần 4-24 Hz) và tăng tốc độ bit lên 000 Kbps trên mỗi kênh. Cách tiếp cận để nén thông tin là như nhau - loại bỏ những phần không có ý nghĩa lắm đối với khả năng nhận biết của tai con người. Tiêu chuẩn MPEG cho phép nén âm thanh ba cấp độ (Lớp). Lớp 768 sử dụng thuật toán đơn giản nhất với độ nén tối thiểu, tức là 1 Kbps trên mỗi kênh. Thuật toán Lớp 192 phức tạp hơn nhưng mức độ nén cao hơn - 2 Kbps trên mỗi kênh. Một thuật toán mạnh mẽ để nén âm thanh kỹ thuật số chất lượng CD (128 lần mà tai người không bị tổn thất), Lớp 11 cung cấp chất lượng âm thanh cao nhất có thể với các hạn chế lưu lượng nghiêm ngặt - không quá 3 Kbps trên mỗi kênh. Nó chủ yếu dành cho Internet. Tầm quan trọng của nó lớn đến mức nó đã nhận được một chữ viết tắt đặc biệt MP64, viết tắt của MPEG Layer 3.

Nhiều trang Internet đã xuất hiện chứa hàng trăm nghìn tệp MP3 của các bản nhạc phổ biến. Với sự trợ giúp của các chương trình phát lại đặc biệt (Real Audio), nhạc MP3 có thể được nghe trong thời gian thực qua Internet, có thể sao chép vô thời hạn (lưu ý: một bài hát thông thường chiếm từ 2 đến 8 MB) và phân phối bất hợp pháp. Máy nghe nhạc MP3 di động đã xuất hiện có giá khoảng 200 USD (ví dụ: Diamond Rio). Ngành công nghiệp âm nhạc, chịu tổn thất đáng kể, đã bắt đầu cuộc chiến tích cực chống lại các trang web MP3 (Hiệp hội Công nghiệp Ghi âm Hoa Kỳ đã phát hiện và đóng cửa hầu hết các trang web đó). Nhưng thần đèn đã được thả ra, bạn không thể nhốt tất cả mọi người được. Adaptec dự đoán hàng tỷ bài hát sẽ được tải xuống qua Internet trong những năm tới và cho biết họ sẽ hỗ trợ MP3 trong phiên bản tiếp theo của EasyCD Creator. Tuy nhiên, trong các tác vụ chỉnh sửa kỹ thuật số, việc nén tín hiệu âm thanh không được sử dụng nên khi tính toán luồng cho phép, phải phân bổ tối đa 1,5 Mbit/s cho thành phần âm thanh.

MPEG-2 trong các tác vụ chỉnh sửa phi tuyến tính

Thuật ngữ “chỉnh sửa phi tuyến tính” không tương ứng với bản chất của quy trình mà chỉ phản ánh một trong những đặc điểm của nó. Trên thực tế, chúng ta đang nói về việc chỉnh sửa video được thực hiện bằng kỹ thuật số trên máy tính. Trong trường hợp này, các đoạn video gốc bắt buộc phải được số hóa và ghi vào ổ cứng dưới dạng tệp thích hợp. Không giống như ổ băng từ, việc truy cập vào bất kỳ tệp phân đoạn nào không yêu cầu tua lại tẻ nhạt (và quá trình này là tuyến tính), tức là tất cả các khung hình video đều có sẵn theo thứ tự ngẫu nhiên. Đặc tính quan trọng này đã dẫn đến việc gọi chỉnh sửa kỹ thuật số là phi tuyến tính, mặc dù rõ ràng là khả năng xử lý kỹ thuật số rộng hơn và phong phú hơn nhiều.

Chúng ta hãy nhớ lại rằng theo Khuyến nghị ITU-R BT.601, khung hình truyền hình là ma trận 720 x 576. Khi tính đến tốc độ khung hình truyền hình là 25 Hz, chúng ta đi đến kết luận rằng một giây của video kỹ thuật số có tỷ lệ 4:2. Biểu diễn :2 yêu cầu 20 byte (736 x 000 x 25 x 2), tức là luồng dữ liệu là 720 MB/s. Việc ghi lại các luồng như vậy là khả thi về mặt kỹ thuật, nhưng nó phức tạp, tốn kém và không hiệu quả trong quá trình xử lý hậu kỳ. Trong thực tế, có tính đến các khả năng thực tế, cần phải giảm đáng kể lưu lượng. Có nhiều thuật toán đã biết thực hiện nén mà không làm mất thông tin, nhưng ngay cả thuật toán hiệu quả nhất trong số đó cũng không cung cấp nhiều hơn khả năng nén gấp đôi đối với các hình ảnh thông thường.

Cho đến gần đây, M-JPEG vẫn thống trị thế giới hệ thống chỉnh sửa video phi tuyến tính. Các giải pháp khác nhau có mức độ nén khác nhau, tương ứng với các mức chất lượng khác nhau của video thu được. Nói một cách đại khái, có thể phân biệt bốn cấp độ ở đây: video tiêu chuẩn (VHS, C-VHS, Video8), siêu video (SVHS, C-SVHS, Hi8), video kỹ thuật số (Betacam SP, DV/DVCAM/DVCPRO, miniDV, Digital8) và video studio (Digital S, DVCPRO50). Để đơn giản, chúng tôi sẽ ký hiệu thêm chúng là Video, S-Video, DV và Studio-TV. Về mặt định lượng, chúng thường được đặc trưng bởi độ phân giải ngang (số lượng phần tử được phân biệt trong một dòng - dòng truyền hình). Người ta tin rằng Video cung cấp độ phân giải lên tới 280 dòng và tương ứng với luồng M-JPEG khoảng 2 MB/s, S-Video - 400 dòng và 4 MB/s, DV - 500 dòng và 3,1 MB/s, và Studio-TV - độ phân giải ít nhất 600 dòng với tốc độ 7 MB/s. Tỷ lệ nén lần lượt là 10:1, 5:1, 5:1 và 3:1 (hãy nhớ rằng thuật toán DV hiệu quả hơn M-JPEG). Nhưng ngay cả việc nén như vậy cũng cần một lượng dung lượng ổ đĩa đáng kể để lưu trữ và xử lý các tệp video. Ví dụ: một phút video M-JPEG cần 120 MB cho chất lượng Video và khoảng 500 MB cho chất lượng Studio-TV. Nhưng bạn muốn làm việc với những video kéo dài hàng chục phút!

Và đây là lúc MPEG-2 xuất hiện. Ngay cả việc chuyển sang khung I cũng cho phép bạn tiết kiệm 15% âm lượng và nếu bạn sử dụng khung P, mức tăng có thể tăng gấp đôi (đối với các nhóm IPPP) và điều này đã rất đáng kể. Đúng, có ý kiến cho rằng trong trường hợp sau, một trong những ưu điểm chính của chỉnh sửa phi tuyến tính sẽ bị mất đi, đó là độ chính xác theo từng khung hình. Đây thực sự là một quan niệm sai lầm. Sử dụng các khung P khác nhau, cấu trúc ban đầu của hình ảnh được khôi phục dễ dàng và nhanh chóng (đối với các bộ xử lý hiện đại, tác vụ như vậy không khó và được thực hiện trong thời gian thực). Về độ chính xác của việc tái tạo, nó giảm đáng kể trong các nhóm dài và/hoặc khi có khung B. Do đó, chẳng hạn, không thể chỉnh sửa DVD-Video (GOP 15/3). Đồng thời, đối với các nhóm ngắn chỉ có khung I và P, quá trình khôi phục diễn ra thực tế mà không có lỗi tích lũy. Do đó, với mã hóa MPEG-2 422P@ML, tốc độ 50 Mbit/s với I-frame (chỉ I-frame) và 25 Mbit/s với nhóm IPPP là đủ để đảm bảo chất lượng phòng thu (xem Bảng 2).

Bảng 2

Kiểu nén	Video	S-Video	DV	Studio-TV
M-JPEG, Mbit/s	16	32	38	56
Khung hình I 422P@ML, Mbit/s	14	28	33	49
I-frame MP@ML, Mbit/s	10	21	25	37
IPPP 422P@ML, Mbit/s	7	14	17	24
IPPP MP@ML, Mbit/s	5	10	12,5	18
IBP 15/3 MP@ML, Mbit/s	2,5	5	6	9

Theo hướng này, các hệ thống chỉnh sửa phi tuyến hiện đại đang phát triển. Cho đến nay có rất ít ví dụ. Đó là FAST 601 [sáu-o-một], Pinnacle miroVideo DC1000 và Matrox DigiSuite DTV. Nhưng ưu điểm của phương pháp này quá rõ ràng nên các giải pháp khác chắc chắn sẽ xuất hiện trong tương lai gần.

Tác giả: Andrey Ryakhin, dựa trên tài liệu từ digitalvideo.ru

Chúng tôi giới thiệu các bài viết thú vị razdela video nghệ thuật:

▪ Mẹo chiếu sáng cho người vận hành

▪ Quay phim đám cưới

▪ Học quay video - mẹo dành cho người mới bắt đầu

Xem các bài viết khác razdela video nghệ thuật.

Đọc và viết hữu ích bình luận về bài viết này.

<< Quay lại

Tin tức khoa học công nghệ, điện tử mới nhất:

Sự tồn tại của quy luật entropy cho sự vướng víu lượng tử đã được chứng minh 09.05.2024

Cơ học lượng tử tiếp tục làm chúng ta ngạc nhiên với những hiện tượng bí ẩn và những khám phá bất ngờ. Gần đây, Bartosz Regula từ Trung tâm Điện toán Lượng tử RIKEN và Ludovico Lamy từ Đại học Amsterdam đã trình bày một khám phá mới liên quan đến sự vướng víu lượng tử và mối liên hệ của nó với entropy. Sự vướng víu lượng tử đóng một vai trò quan trọng trong khoa học và công nghệ thông tin lượng tử hiện đại. Tuy nhiên, sự phức tạp trong cấu trúc của nó khiến cho việc hiểu và quản lý nó trở nên khó khăn. Khám phá của Regulus và Lamy chứng tỏ rằng sự vướng víu lượng tử tuân theo một quy luật entropy tương tự như quy luật đối với các hệ cổ điển. Khám phá này mở ra những góc nhìn mới trong khoa học và công nghệ thông tin lượng tử, giúp chúng ta hiểu sâu hơn về sự vướng víu lượng tử và mối liên hệ của nó với nhiệt động lực học. Kết quả nghiên cứu cho thấy khả năng đảo ngược của các phép biến đổi vướng víu, điều này có thể đơn giản hóa đáng kể việc sử dụng chúng trong các công nghệ lượng tử khác nhau. Mở một quy tắc mới ... >>

Điều hòa mini Sony Reon Pocket 5 09.05.2024

Mùa hè là thời gian để thư giãn và du lịch, nhưng thường thì cái nóng có thể biến thời gian này thành một sự dày vò không thể chịu đựng được. Gặp gỡ sản phẩm mới của Sony - điều hòa mini Reon Pocket 5, hứa hẹn sẽ mang đến mùa hè thoải mái hơn cho người dùng. Sony vừa giới thiệu một thiết bị độc đáo - máy điều hòa mini Reon Pocket 5, giúp làm mát cơ thể trong những ngày nắng nóng. Với nó, người dùng có thể tận hưởng sự mát mẻ mọi lúc, mọi nơi chỉ bằng cách đeo nó quanh cổ. Máy điều hòa mini này được trang bị tính năng tự động điều chỉnh các chế độ vận hành cũng như cảm biến nhiệt độ và độ ẩm. Nhờ công nghệ tiên tiến, Reon Pocket 5 điều chỉnh hoạt động tùy thuộc vào hoạt động của người dùng và điều kiện môi trường. Người dùng có thể dễ dàng điều chỉnh nhiệt độ bằng ứng dụng di động chuyên dụng được kết nối qua Bluetooth. Ngoài ra, còn có áo phông và quần short được thiết kế đặc biệt để thuận tiện, có thể gắn một chiếc điều hòa mini. Thiết bị có thể ồ ... >>

Năng lượng từ không gian cho Starship 08.05.2024

Sản xuất năng lượng mặt trời trong không gian ngày càng trở nên khả thi hơn với sự ra đời của các công nghệ mới và sự phát triển của các chương trình không gian. Người đứng đầu công ty khởi nghiệp Virtus Solis chia sẻ tầm nhìn của mình về việc sử dụng Starship của SpaceX để tạo ra các nhà máy điện trên quỹ đạo có khả năng cung cấp năng lượng cho Trái đất. Startup Virtus Solis đã tiết lộ một dự án đầy tham vọng nhằm tạo ra các nhà máy điện trên quỹ đạo sử dụng Starship của SpaceX. Ý tưởng này có thể thay đổi đáng kể lĩnh vực sản xuất năng lượng mặt trời, khiến nó trở nên dễ tiếp cận hơn và rẻ hơn. Cốt lõi trong kế hoạch của startup là giảm chi phí phóng vệ tinh lên vũ trụ bằng Starship. Bước đột phá công nghệ này được kỳ vọng sẽ giúp việc sản xuất năng lượng mặt trời trong không gian trở nên cạnh tranh hơn với các nguồn năng lượng truyền thống. Virtual Solis có kế hoạch xây dựng các tấm quang điện lớn trên quỹ đạo, sử dụng Starship để cung cấp các thiết bị cần thiết. Tuy nhiên, một trong những thách thức quan trọng ... >>

Tin tức ngẫu nhiên từ Kho lưu trữ

Chó ngửi thấy mùi căng thẳng của con người 09.10.2022

Những người nuôi chó thường nhận thấy rằng trong những giai đoạn khó khăn, vật nuôi cư xử bất thường. Hóa ra đây không phải là một trò chơi của trí tưởng tượng: những con chó thực sự có thể trải nghiệm những trải nghiệm tiêu cực của người khác và phản ứng lại chúng.

Các nhà sinh vật học từ Đại học Queen ở Belfast (Bắc Ireland) phát hiện ra rằng những con chó thuộc các giống khác nhau có thể xác định tình trạng căng thẳng của con người với độ chính xác hơn 90%. Nhờ khứu giác nhạy bén, những "người bạn của con người" bốn chân trải qua những sai lệch nhỏ nhất trong dấu vết sinh hóa của con người.

Cơ thể của nhiều loài động vật, bao gồm cả con người, liên tục thải VOC ra môi trường. Đây là biểu hiện của một cơ chế tiến hóa: mùi tạo ra toàn bộ hệ thống tín hiệu sinh hóa qua đó các loài động vật tương tác với nhau.

Bởi vì khứu giác khá thô, một người chỉ cảm nhận được những mùi mạnh nhất, nhưng các loài động vật như chó có thể nắm bắt được ngay cả những mùi hương yếu nhất và tinh tế nhất. Xét rằng con người đã bắt đầu thuần hóa một số răng nanh cách đây hàng chục nghìn năm, loài chó có thể đã thành thạo khả năng đánh hơi tình trạng tâm lý của chủ nhân.

Các nhà khoa học đã kiểm tra giả thuyết này bằng một loạt thí nghiệm. Đầu tiên, họ lấy mẫu mồ hôi và hơi thở của 36 người đang nghỉ ngơi. Các mẫu sau đây được lấy từ cùng một người, nhưng đã ở trong trạng thái căng thẳng, được xác định bằng cách tự đánh giá của những người tham gia và các chỉ số khách quan như nhịp tim và huyết áp. Các tác giả trộn ngẫu nhiên tất cả các mẫu này với các mẫu có mùi khác, bao gồm cả những mùi vô nhân đạo.

Tiếp theo, các nhà nghiên cứu chọn 720 con chó thuộc các giống khác nhau và tiến hành tổng cộng 93,75 bài kiểm tra phân biệt mùi hương. Và trong 96,88% trường hợp, các con vật phản ứng với "mùi của sự căng thẳng" - chúng bắt đầu cư xử cảnh giác và bồn chồn. Đồng thời, độ chính xác nhận dạng đạt 90% và không giảm xuống dưới XNUMX%.

Các tác giả của nghiên cứu kết luận rằng tình trạng căng thẳng làm thay đổi thành phần sinh hóa của mồ hôi và hơi thở của con người, và loài chó có thể cảm nhận được điều đó nhờ khứu giác nhạy bén. Do đó, chúng có thể được sử dụng như một thiết bị phát hiện nhạy cảm các quá trình tâm lý tiêu cực như lo lắng, cơn hoảng sợ và rối loạn căng thẳng sau chấn thương. Nhưng vẫn chưa rõ chính xác những gì thay đổi trong thành phần của những chất lỏng sinh học này và những chất nào mà những con chó phản ứng.

Khám phá mới phù hợp với bức tranh của các nghiên cứu sơ bộ: chẳng hạn, họ đã chỉ ra rằng những con chó có thể nghe hoàn toàn tốt những người bị nhiễm coronavirus. Độ chính xác phát hiện vượt quá 97%, ngay cả khi bệnh nhân không có bất kỳ triệu chứng nào của Covid-19. Vì vậy, hầu như không có gì ngạc nhiên khi những chú chó đã học được cách xác định sự lo lắng và hồi hộp của chủ nhân. Hơn nữa, qua hàng chục nghìn năm, những con chó thuần hóa, không giống như những con chó hoang dã của chúng, đã nhận được một số cơ chế bẩm sinh được “điều chỉnh” đặc biệt cho con người.

Tin tức thú vị khác:

▪ Máy ảnh siêu mỏng không có ống kính quang học

▪ Sự ra mắt của người điều khiển robot

▪ Thấu kính thủy tinh Chalcogenide

▪ Micro Segway Ninebot mini

▪ GPU kép Nvidia Tesla K80

Nguồn cấp tin tức khoa học và công nghệ, điện tử mới

Tài liệu thú vị của Thư viện kỹ thuật miễn phí:

▪ phần của trang web Nội dung gián điệp. Lựa chọn bài viết

▪ bài viết Ba mươi lăm nghìn người đưa thư. biểu hiện phổ biến

▪ bài viết Loài động vật nào có tính lãnh thổ đến mức chúng có thể chết chỉ vì ở gần họ hàng? đáp án chi tiết

▪ bài viết Tàu lượn Vympel-9. phương tiện cá nhân

▪ bài viết Bộ xả đá tủ lạnh điện tử. Bách khoa toàn thư về điện tử vô tuyến và kỹ thuật điện

▪ bài báo Ổn áp có giới hạn dòng điện, 12-15 vôn 3 ampe. Bách khoa toàn thư về điện tử vô tuyến và kỹ thuật điện

Để lại bình luận của bạn về bài viết này:

Tất cả các ngôn ngữ của trang này

Trang chủ | Thư viện | bài viết | Sơ đồ trang web | Đánh giá trang web