Το video σε ψηφιακή μορφή μπορεί να προκύψει είτε με απευθείας "σύλληψη" του σε ψηφιακό μέσο πχ με ψηφιακή βιντεοκάμερα είτε με μετατροπή ενός αναλογικού σήματος. Σε κάθε περίπτωση το ψηφιακό σήμα έχει κάποια ιδιαίτερα χαρακτηριστικά σε σχέση με το αναλογικό και θα τα μελετήσουμε στην ενότητα αυτή.

1. Χαρακτηριστικά Ψηφιακού Video (Θέματα Κωδικοποίησης)

Το ψηφιακό video μπορεί να εκληφθεί ως ένα σύνολο στατικών εικόνων που εναλλάσσονται γρήγορα πολλές φορές το δευτερόλεπτο. Συνεπώς διακρίνουμε ότι το video "κληρονομεί" τα χαρακτηριστικά των εικόνων που το αποτελούν (χρωματική και χωρική ανάλυση -  color special resolution) και έχει επίσης το χαρακτηριστικό της συχνότητας εναλλαγής τους.

Συχνότητα Καρέ (Frame Rate)

Το πρότυπο για την προβολή οποιοδήποτε είδους μη-film video είναι 30 καρέ το δευτερόλεπτο ενώ για film είναι 24 30 καρέ το δευτερόλεπτο. Συνεπώς η πληροφορία video αποτελείται από 30 ή 24 εικόνες (ή καρέ) κάθε δευτερόλεπτο.

Στην παραδοσιακή τηλεόραση τα καρέ αυτά χωρίζονται σε δύο μέρη, τις άρτιες και περιττές γραμμές, σχηματίζοντας τα λεγόμενα πεδία (fields). Εδώ έγκειται και η μεγάλη διαφορά μεταξύ του τρόπου προβολής της εικόνας από μία τηλεόραση και έναν υπολογιστή. Όταν λοιπόν η τηλεόραση προβάλει το αναλογικό της σήμα video παρουσιάζει πρώτα τις περιττές γραμμές (πρώτο πεδίο) και μετά τις άρτιες (δεύτερο πεδίο). Κάθε ζευγάρι σχηματίζει ένα καρέ και εμφανίζονται 60 πεδία το δευτερόλεπτο, δηλαδή 30 καρέ το λεπτό. Αυτό είναι το λεγόμενο "interlaced" video.

Η οθόνη ενός υπολογιστή χρησιμοποιεί μία τεχνική για την ανανέωση του περιεχομένου της οθόνης που ονομάζεται "σταδιακή σάρωση" (progressive scan). Σύμφωνα με τη μέθοδο αυτή η οθόνη δεν χωρίζεται σε πεδία και κάθε γραμμή εμφανίζεται με τη σειρά από πάνω ως κάτω. Όλο το καρέ εμφανίζεται 30 φορές το δευτερόλεπτο και η μέθοδος αυτή ονομάζεται "non-interlaced" video.

Χρωματική Ανάλυση (Color Resolution)

Η έννοια της χρωματικής ανάλυσης αναφέρεται στο πλήθος των διαφορετικών χρωμάτων που εμφανίζονται ταυτόχρονα στην οθόνη. Οι υπολογιστές κωδικοποιούν το χρώμα σε μία μορφή τριών διακριτών συνιστωσών "RGB" (red-green-blue) δηλαδή κόκκινη, πράσινη και μπλε συνιστώσα. Όλα τα διακριτά χρώματα κωδικοποιούνται με ένα συγκεκριμένο πλήθος δυαδικών ψηφίων (bits). Το πλήθος αυτό ορίζει συνεπώς και τη μέγιστη τιμή των διαφορετικών χρωμάτων που υποστηρίζονται (με n bits 2n διαφορετικοί συνδυασμοί).

Μία άλλη συχνά χρησιμοποιούμενη μορφή είναι η "YUV". Αν και δεν υπάρχει άμεσος συσχετισμός μεταξύ RGB και YUV τα συστήματα αυτά μοιάζουν στο ότι έχουν και τα δύο διάφορα επίπεδα βάθους χρώματος (color depth), δηλαδή μέγιστο πλήθος χρωμάτων.

Τυπικές αναλύσεις χρώματος RGB είναι 8 bits/pixel (256 χρώματα), 16 bits/pixel (65,536 χρώματα), 24 bits/pixel (16.7 εκατ. χρώματα) και 32 bits/pixel το λεγόμενο true color.

Τυπικές αναλύσεις χρώματος YUV είναι 7 bit, 4:1:1 ή 4:2:2 (περίπου 2 εκατ. χρώματα), και 8 bit, 4:4:4 (περίπου 16 εκατ. χρώματα).

Χωρική Ανάλυση (Spatial Resolution)

Η χωρική ανάλυση είναι στην ουσία το μέγεθος της εικόνας. Όπως και με τα πρότυπα RGB και YUV δεν υπάρχει άμεση συσχέτιση μεταξύ αναλύσεων αναλογικών τηλεοράσεων και οθονών υπολογιστών.

Οι κλασσικές τηλεοράσεις προβάλουν μια πλήρη εικόνα χωρίς τα περιθώρια των οθονών υπολογιστών. Στο πρότυπο NTSC η ανάλυση είναι 768 x 484 ενώ στο PAL λίγο μεγαλύτερο 768 x 576.

Οι οθόνες των υπολογιστών υποστηρίζουν διάφορες αναλύσεις όπως η Standard VGA 640 x 480, 800 x 600 , 1024 x 768 κτλ. Στην πράξη όμως το ψηφιακό video δεν απαιτεί τόσο μεγάλες αναλύσεις και συνήθως έχει ανάλυση μικρότερη του 640 x 480.

Καθώς οι αναλύσεις διαφέρουν από αναλογικές και ψηφιακές οθόνες η μετατροπή αναλογικού σε ψηφιακό σήμα πρέπει να λάβει το γεγονός αυτό υπόψη και συνέπεια είναι κάποια απώλεια στην ποιότητα του σήματος.

Συμπίεση (Compression)

Όπως είδαμε το ψηφιακό video είναι ουσιαστικά ένα σύνολο στατικών εικόνων που εναλλάσσονται γρήγορα πολλές φορές το δευτερόλεπτο. Επειδή όμως ο όγκος του συνόλου της πληροφορίας αυτής είναι πολύ μεγάλος έχουν δημιουργηθεί διάφορες τεχνικές συμπίεσης των δεδομένων. Κάθε αλγόριθμος συμπίεσης έχει τα δικά του χαρακτηριστικά όπως η πολυπλοκότητα του, η ποιότητα του συμπιεσμένου video που παράγει αλλά και οι δυνατότητες συμπίεσης που έχει ως προς το ασυμπίεστο video. Τα διάφορα πρότυπα αναπτύχθηκαν βέβαια για να εξυπηρετήσουν και διαφορετικές ανάγκες πχ έχουμε πολύ μεγάλο bandwidth οπότε θέλουμε μικρή συμπίεση χωρίς απώλειες (MPEG-2). Σε άλλες περιπτώσεις το bandwidth είναι τόσο περιορισμένο ώστε μας αρκεί μια κακής ποιότητας εικόνα που όμως να είναι ικανή να μεταδοθεί (MPEG-4).

Ολοκληρώνοντας πρέπει να πούμε ότι σε τελική ανάλυση η εφαρμογή που χρειάζεται το σήμα video είναι αυτή που θα καθορίσει τις προδιαγραφές της ποιότητας του. Οι προδιαγραφές αυτές καθορίζουν τις τιμές που θα πρέπει να έχει το σύνολο των προαναφερθέντων χαρακτηριστικών. Για παράδειγμα σε ορισμένες περιπτώσεις μπορεί να είναι αρκετή ανάλυση 1/4 της οθόνης, με συχνότητα 15 καρέ το δευτερόλεπτο και χρωματική ανάλυση 8 bits per pixel ενώ σε άλλες πλήρης οθόνη (768 x 484), με συχνότητα 24 ή 30 καρέ το δευτερόλεπτο), και 24 bits per pixel (16.7 εκατ. χρώματα).

2. Τύποι Ψηφιακού Video (Video Formats)

Τα διάφορα formats του ψηφιακού video μπορούμε να τα κατηγοριοποιήσουμε ως προδιαγραφές συμπίεσης video και προδιαγραφές ομαδοποίησης και συγκέντρωσης πολυμέσων - κινούμενη εικόνα και ήχο (Media Packaging).

Τύποι Συμπίεσης Video (Compression Formats)

Όπως έχουμε ήδη αναφέρει υπάρχουν διάφορα είδη τεχνικών συμπίεσης video. Εμείς θα επιχειρήσουμε εδώ μια σύντομη απαρίθμηση τους κάνοντας παράλληλα κάποια συμπληρωματικά σχόλια.

Ανοικτά Πρότυπα Συμπίεσης Video (Open Video Compression Standards)

  1. MPEG-1: Το πρότυπο αυτό βασίζεται στη παρατήρηση ότι το σύνολο των διαδοχικών εικόνων μιας ακολουθίας video θα διαφέρει λίγο με αποτέλεσμα να έχουμε αρκετή πλεονάζουσα πληροφορία. Η συμπίεση που επιτυγχάνει είναι της τάξης του 26:1. To πρότυπο MPEG-1 είχε σαν αρχικό στόχο την αποθήκευση συγχρονισμένου ήχου και έγχρωμης κινούμενης εικόνας σε οπτικό δίσκο (CD-ROM). Αυτός ήταν ο λόγος όπου το για το ηχητικό κανάλι δεσμεύτηκαν 200 ως 320 Kbps (για ποιότητα ήχου εφάμιλλής του CD) ενώ για την κινούμενη εικόνα είναι 1.15 έως 1.2 Mbps. Η ποιότητα της εικόνας είναι επιπέδου ενός οικιακού video (VCR).
  2. MPEG-2 ή H.262: Το MPEG-2 απευθύνεται σε εφαρμογές με μεγάλες απαιτήσεις στην ποιότητα του video. Μάλιστα αρχικά προοριζόταν για συμπίεση video με ποιότητα στούντιο και απαιτούμενο bandwidth από 4 έως 6Mbps. Καθώς όμως ενσωμάτωσε και το MPEG-3, το οποίο εγκαταλείφθηκε, υποστηρίζει πλέον και διάφορα είδη τηλεόρασης υψηλής ευκρίνειας (HDTV). Το πρότυπο απαιτεί μεταβλητούς ρυθμούς μετάδοσης, καθώς ο βαθμός συμπίεσης μεταβάλλεται αντιστρόφως ανάλογα με την πολυπλοκότητα των πλαισίων που κωδικοποιούνται
  3. MPEG-4: Το MPEG-4 προορίζεται για εφαρμογές με πολύ μικρό διαθέσιμο bandwidth πχ 4.8 έως 64Κbps. Δηλαδή bandwidth όπου με τους παραδοσιακούς αλγόριθμους η αποστολή video είναι απαγορευτική. Το πεδίο εφαρμογής του είναι πολύ ευρύ και προσανατολίζεται κυρίως σε εφαρμογές τηλεδιάσκεψης . Το πρότυπο αυτό βρίσκεται σε εξέλιξη και η ολοκλήρωση του πρόκειται να αλλάξει αρκετά τον χώρο της τηλεκπαίδευσης.
  4. H.261: Είναι το πρότυπο που καθορίζει τον τρόπο όπου η εικόνα συμπιέζεται και κωδικοποιείται για μετάδοση πάνω από δίκτυα χαμηλών ταχυτήτων. Χρησιμοποιείται από τα περισσότερα συστήματα τηλεδιάσκεψης ώστε να εξασφαλίζεται η μεταξύ τους συμβατότητα.
  5. H.263, H.263+: Είναι μία παραλλαγή του H.261 αλλά είναι ειδικά σχεδιασμένο για μετάδοση με χαμηλό bit rate. Χρησιμοποιείται στο πρότυπο H.324 για δίκτυα τύπου General Switched Telephone Network (GSTN), δηλαδή απλές τηλεφωνικές αναλογικές γραμμές, και στο πρότυπο H.323 για δίκτυα IP ταχυτήτων 64-128kbps.
  6. MJPEG (Motion JPEG): Το πρότυπο αυτό βασίζει τη συμπίεση του video στον εντοπισμό και στην εξάλειψη του χωρικού πλεονάσματος των εικόνων που αποτελούν το video. Δηλαδή συμπιέζονται ξεχωριστά οι εικόνες που το αποτελούν, γεγονός που του προσδίδει αντοχή σε λάθη κατά την μετάδοση (καθώς κάθε καρέ είναι ανεξάρτητο) αλλά και δυνατότητα επέμβασης σε επίπεδο καρέ.
  7. DV: DV-25 (25 Mbps), DV-50 (50 Mbps)

Μία συγκριτική ανάλυση κάποιων από τα παραπάνω πρότυπα φαίνεται στον παρακάτω πίνακα.

Standard Bandwidth Compression ratio Rate Loss
Motion JPEG 1-10 Mbps 7-27:1 Variable Yes
MPEG-1 1.2-2 Mbps 100:1 Variable Yes
MPEG-2 (H.262) 4-60 Mbps 30-100:1 Variable Yes
H.261 64 Kbps – 2 Mbps 24:1 Constant Ο
DVI 1.2-2.5 Mbps 160:1 Ο Yes
CCIR 723 34-45 Mbps 3-5:1 Ο Ο

Αναφορές :

Τύποι Συμπίεσης Video που δεν είναι standards (Proprietary Video Compression Formats)

  1. Real Video G2, Real 8, αναπτύχθηκε με συνεργασία των εταιριών Real και Intel.
  2. Sorensen Video, χρησιμοποιείται από το Apple QuickTime [http://www.sorenson.com/]
  3. Microsoft Windows Media 8, μία "βελτιωμένη" έκδοση του προτύπου MPEG-4.
  4. On2: TrueMotion VP3 [http://on2.com/]
  5. Pixelon
  6. Tranz-Send
  7. Intel Indeo, βασίζεται σε τεχνικές διανυσματικής κβαντοποίησης (vector quantization).
  8. Cinepak
  9. Motion Vector Quantization method (MVQ), χρησιμοποιείται από τη AVS Technologies [http://www.avstechnologies.com/]

Για περισσότερες πληροφορίες για τις διάφορες τεχνικές συμπίεσης και διάφορα codec (coders - decoders) μπορεί κανείς να ανατρέξει στη διεύθυνση [Codec Warehouse] http://pages.prodigy.net/jagfire3/codecs.html

 

Τύποι Ομαδοποίησης και Συγκέντρωσης Πολυμέσων (Media Packaging and Meta Formats)

Υπάρχει ένα μεγάλο πλήθος formats τα οποία χρησιμοποιούνται όλα σε αρκετά μεγάλο βαθμό στο χώρο του ψηφιακού video. Κάποια από αυτά είναι προϊόντα εταιριών (Proprietary) ενώ άλλα είναι ανοικτά πρότυπα (open). Εδώ θα επιχειρήσουμε μια σύντομη απαρίθμηση και κατηγοριοποίηση τους σε δύο πίνακες. Παράλληλα σημειώνουμε ορισμένες επεξηγηματικές πληροφορίες καθώς και αναφορές για περισσότερες πληροφορίες σχετικές με το εκάστοτε πρότυπο.

Proprietary Formats:

ΤΥΠΟΣ

ΠΕΡΙΓΡΑΦΗ - ΣΧΟΛΙΑ

ΠΛΗΡΟΦΟΡΙΕΣ - LINKS

Apple Quicktime

είναι ανοικτό πρότυπο και μπορεί κανείς να αποκτήσει άδεια από την εταιρία Apple

http://developer.apple.com/quicktime/

Microsoft ASF

είναι πρότυπο που μπορεί να εμπεριέχει όλα τα είδη πολυμέσων (container), δηλαδή ενθυλακώνει διάφορους άλλους τύπους. Χρησιμοποιείται κυρίως για streaming video

http://msdn.microsoft.com/windowsmedia

Microsoft AVI

είναι πρότυπο που μπορεί να εμπεριέχει όλα τα είδη πολυμέσων (container), δηλαδή ενθυλακώνει διάφορους άλλους τύπους. Το πρότυπο θυμίζει περισσότερο πρότυπο τύπου αρχείου (file format). Πιο δημοφιλές από το ASF.

http://msdn.microsoft.com/windowsmedia

Windows Media Metafiles

 

http://msdn.microsoft.com/workshop/imedia/windowsmedia/CrContent/asx.asp

Real System Information Files

Τα αρχεία τύπου .ram είναι αρχεία ήχου ή video που αναπαράγονται από την εφαρμογή Real Player
Τα αρχεία τύπου *.rpm χρησιμοποιούνται για παρουσιάσεις.

http://service.real.com/help/library/guides/

http://service.real.com/help/library/guides/production8/htmfiles/server.htm#14171

Open Standards:

ΤΥΠΟΣ ΠΕΡΙΓΡΑΦΗ - ΣΧΟΛΙΑ ΠΛΗΡΟΦΟΡΙΕΣ - LINKS
SMIL (W3C)

Έχει αναπτυχθεί το πρότυπο από W3C και χρησιμοποιείται από την Real Networks και από το Quicktime.

http://www.realnetworks.com/devzone/howto/resources/index.html?src=noref,nosrc
http://service.real.com/help/library/guides/production8/htmfiles/smil.htm#33551
MPEG-4

Προορίζεται κυρίως για εφαρμογές όπου υπάρχει πολύ μικρό διαθέσιμο bandwidth.

http://www.cselt.it/leonardo/icjfiles/mpeg-4_si/
MPEG-7

Είναι ακόμη υπό ανάπτυξη.

 

Related Resources W3C - Extended Log File Format