rungraveewan


ตอบ MPEG (ย่อมาจาก Motion Picture Expert Group) ซึ่งเป็นมาตรฐานสากลที่ถูกออกแบบขึ้นมาเพื่อปฏิวัติการบีบอัดข้อมูลของภาพเคลื่อนไหวเลยก็ว่าได้ เนื่องจากผู้ใช้งานพีซีโดยทั่วไปแล้วต่างคาดหวังที่จะได้เห็นภาพเคลื่อนไหวบนจอภาพได้เช่นเดียวกับการดูวีดีโอ

MPEG ที่กำลังจะก้าวขึ้นมาเป็นผู้ครองตลาดอย่างสมบูรณ์แบบในอีกไม่นานนี้ ซึ่งคุณก็จะสามารถใช้อุปกรณ์พีซีเดิม ๆ ของ คุณ อย่างเช่น เครื่องเล่นซีดีรอมแบบ Single Speed ร่วมกับ MPEG เพื่อแสดงภาพเคลื่อนไหวได้โดยเพียงแต่เพิ่มเอาการ์ดคลาย ข้อมูล MPEG (Decompression/Decoding) เข้าไปนั้น MPEG ก็ได้ถูกออกแบบมาเพื่อให้สามารถบีบอัดข้อมูลภาพเคลื่อนไหวได้มากถึง 180 เท่าเช่นกัน ด้วยคุณภาพการแสดงผลที่ใกล้เคียงกับโทรทัศน์จากแผ่นซีดีรอมแบบ Single Speed เท่านั้น นับว่าเป็นปรากฏการณ์ที่สร้างความฮือฮาให้แก่บรรดาผู้ที่สนใจเป็นอันมาก

การพัฒนา MPEG

ความพยายามในการพัฒนามาตรฐานเพื่อบีบอัดข้อมูลเสียงและวีดีโอมีมานานแล้วในปี 1992 คณะกรรมการ MPEG ได้กำหนดมาตรฐาน MPEG 1 มาตรฐานนี้นำมาใช้กับเครื่องเล่นวิดีโอแบบดิจิตอล และกลุ่มบริษัทผู้ผลิตส่วนใหญ่อยู่ที่ญี่ปุ่น การพัฒนาเน้นการนำสัญญาษวิดีโอและเสียงส่งออกเป็นสตรีม แต่เป็นข้อมูลแบบดิจิตอล ลักษณะเหมือนระบบเครื่องที่เล่นวิดีโอแบบอะนาล็อกที่ใช้กันตามบ้าน การใช้งานจึงเน้นข้อมูลวิดีโอที่มีคุณภาพแบบเครื่องเล่นวิดีโอ

ในปี ค.ศ. 1995 คณะกรรมการ MPEG ได้สรุปและสร้างมาตรฐานใหม่คือ MPEG 2 โดยเน้นให้ MPEG 2 นำมาใช้กัน DVD-Digital Versatile Dist และระบบการรับส่งข้อมูลสัญญาณโทรทัศน์ MPEG 2 มีข้อเด่นคือสามารถใช้ในระบบกระจายสัญญาณแบบเคเบิล ที่จัดการรูปแบบบริการได้กว้างขวางเช่นในเคเบิลทีวี โดยกระจายจากเครื่องเซิร์ฟเวอร์ไปยังช่องกระจายสัญญาณ อย่างไรก็ตาม ระบบการจัดการข้อมูล MPEG 2 ก็ยังเป็นแบบสตรีมและต่อเนื่อง ดังนั้นจึงมีข้อจำกัดในเรื่องการทำให้ระบบมีลักษณะโต้ตอบได้ คณะกรรมการกำหนดมาตรฐานได้มีความพยายามกำหนดมาตรฐานใหม่ และกำหนดให้ออกใช้ได้ในปลายปี ค.ศ. 1999 นี้ โดยใช้ชื่อมาตรฐานว่า MPEG 4 สิ่งที่น่าสังเกตคือคณะกรรมการไม่ได้กำหนด MPEG 3 โดยทำการข้ามเลข 3

ขณะเดียวกันคณะกรรมการ MPEG ก็ได้ดำเนินการกำหนดมาตรฐานใหม่ โดยกำหนดหมายเลขไว้แล้ว คือ MPEG 7 การใช้เลข 7 ต่อจากเลข 4 คงเป็นคำถามของหลายคนว่า เลข 5 และ 6 หายไปไหน ทำไมไม่ใช้เลข 8 ซึ่งถ้าเริ่มจาก 1,2,4 ก็น่าจะเป็น 8 ต่อไปเหตุผลของการใช้เลข 7 ตามคำแนะนำของคณะกรรมการกล่าวว่า เลข 7 เป็นเลขนำโชค การใช้ MPEG 7 จึงนำจะเหมาะสม MPEG 7 มีกำหนดการประกาศเป็นมาตรฐานในเดือนกันยายน ปี ค.ศ. 2001 MPEG 1 และ 2 เน้นในเรื่องการเข้ารหัสเพื่อการบีบอัดสัญญาณวิดีโอเพื่อให้ใช้ในการรับส่งแบบดิจิตอลแต่จากการพัฒนาการทางด้านมัลติมีเดียและเครือข่ายคอมพิวเตอร์ทำให้ต้องพัฒนาให้รองรับ โดยเฉพาะระบบการมีปฏิสัมพันธ์ การแสดงแบบสามมิติและการแสดงผ่านทางเว็บ การแสดงผลแบบมัลติมีเดียจึงต้องเน้นแบบเป็นออบเจ็กต์ โดยมีฉากและสคริปต์ช่วยกำหนดการแสดงผล และรองรับการประยุกต์แบบสองทิศทางที่มีการโต้ตอบกันได้

มาตรฐาน MPEG 4 ยังคงเน้นในเรื่องการส่งผ่านมาในชั้นขนส่งข้อมูล ซึ่งการขนส่งข้อมูลอาจมีออบเจ็กต์ที่แยกจากกันมาในช่องทางสื่อสารที่ต่างกัน แต่สามารถนำมารวมกันได้ และประกอบกันเป็นภาพที่ต้องการการเชื่อมโยงตามมาตรฐาน MPEG 4 เน้นให้เป็นโมเดลของออบเจ็กต์ที่นำมาประกอบกันเป็นภาพ และอาจแสดงผลเป็นภาพแบบ 3 มิติได้ โดยมีเครือข่ายเสมือนเป็นเส้นทางขนส่งข้อมูล การขนส่งข้อมูลอาจมาจากหลายทาง หรือขนส่งมาบนตัวกลางของเครือข่ายในลักษณะตามมาตรฐานระดับเครือข่าย แต่เมื่อมาถึงปลายทางจะมีการนำมาประกอบภาพและเสียงให้ถูกต้องตามสภาพการใช้งานจริง และให้ทันตามเวลาจริง การที่ MPEG 4 มีความสลับซับซ้อนในการประยุกต์ใช้งาน โดยเฉพาะการใช้เทคโนโลยีออบเจ็กต์โอเรียนเต็ด ทำให้ต้องมีการสร้างออบเจ็กต์มาตรฐานออบเจ็กต์เหล่านี้จะเก็บไว้ที่ปลายทาง ทางต้นทางจะบอกเพียงว่าจะใช้ออบเจ็กต์ใด การเรียกใช้และประมวลผลจะกระทำที่ปลายทางเหมือนการใช้เบราเซอร์ในปัจจุบัน เพื่อให้การบีบอัดและการใช้งานผ่านช่องสื่อสารที่มีข้อจำกัดในเรื่องแถบกว้าง MPEG 4 จึงกำหนดภาษาที่ใช้ในการสั่งการให้อุปกรณ์ปลายทางดำเนินการตามภาษาสั่งการนี้มีชื่อว่า BIFS-Binary Format for Scenes ภาษานี้เป็นเพียงคำสั่งที่จะบอกรายละเอียด แนวคิดของภาษานี้มาจาก VRML-Virtual Reality Modeling Language ซึ่งใช้ในการอธิบายการแสดงผลภาพเคลื่อนไหวแบบ 3D บนอินเทอร์เน็ต การใช้ภาษาสั่งการนี้ทำให้เครื่องปลายทางที่ใช้ในการแสดงผลต้องทำงานได้เร็วและลดขนาดของข้อมูลที่ใช้ใน MPEG 4 ได้น้อยลงไปมากสิ่งที่สำคัญคือ BIFS เป็นภาษาสั่งการแบบเวลาจริง และเป็นแบบสตรีม ดังนั้นระบบ 3D และการซิงโครไนซ์ ระหว่างกันเป็นเรื่องใหญ่ และจะต้องดำเนินการให้ตรงเวลา เพื่อสร้างระดับมาตรฐานความน่าเชื่อถือ หรือที่เรียกว่า Qos MPEG 4 ยังเน้นการเชื่อมโยงกับภาษาจาวา เพื่อให้ทรัพยากรที่ใช้บนเครือข่ายที่ทำงานด้วยภาษาจาวาเป็นเรื่องที่ใช้งานร่วมกันได้

สิ่งที่สำคัญคือ MPEG 4 ได้รวมเอาโครงสร้างของโมเดลทางคณิตศาสตร์และการประมวลผล ตลอดจนอัลกอริธึมที่สำคัญไว้ โดยเครื่องที่ใช้ในการแสดงผลต้องมีขีดความสามารถในเชิงการประมวลผลโมเดลทางคณิตศาสตร์นี้ให้เร็ว เพราะการบีบอัดจะเก็บและบอกเฉพาะโครงสร้างหรือวิธีการคำนวณที่อุปกรณ์ปลายทางต้องดำเนินการต่อไปเอง การพัฒนาและประยุกต์ใช้มัลติมีเดียในปัจจุบันยังมีข้อจำกัดอยู่อีกมาก โดยเฉพาะรูปแบบการแสดงผลแบบมีปฏิสัมพันธ์และการแสดงผลวิดีโอที่มีคุณภาพ MPEG 4 จึงเป็นมาตรฐานหนึ่งที่เตรียมการสำหรับระบบมัลติมีเดียในอนาคต โดยเน้นว่าระบบการประมวลผลของพีซีจะดีขึ้นอีกมาก และระบบเครือข่ายคอมพิวเตอร์จะพัฒนาไปข้างหน้าอีก ความหวังของการใช้ MPEG 4 จึงไม่ไกลเกินจริง


(ข) GIF และ JPEG คืออะไรจงอธิบายโดยละเอียดที่สุดและย่อมาจากคำเต็มว่าอะไร

ตอบ GIF ย่อมาจาก Graphic Interchange Format ถูกสร้างขึ้นมาเพื่อการถ่ายเทข้อมูลไปยัง CompuServe Online Service มันพอจะใช้ได้บนเครื่องพีซีทั่วไป และบนระบบยูนิกซ์ได้ด้วย และสามารถใช้ได้ถึง 24-bit และมีขนาด 64000 x 64000จุดและความสามารถที่ใช้ในการบีบข้อมูลก็เป็นของLZX(Lempel-Zex & Watch) ทำให้ได้ไฟล์ที่มีขนานเล็ก เพราะใช้เทคนิคการบีบข้อมูลเหมือนที่ใช้กับ PKZIP ดังนั้นคุณที่เคยใช้ PKZIP บีบอัดไฟล์เหล่านี้ จะเห็นว่าขนานไม่ค่อยเปลี่ยนแปลงหรือบางทีอาจใหญ่กว่าไฟล์ก่อนที่จะบีบอัดข้อมูลซะอีก ก็เพราะว่าไฟล์กราฟฟิกตัวนี้เหมือนเคยผ่านการบีบอัดมาแล้วครั้งหนึ่ง จึงไม่ต้องสงสัยเลยว่าทำไมจึงเป็นเช่นนั้น

JPEG คืออะไรจงอธิบายโดยละเอียดที่สุดและย่อมาจากคำเต็มว่าอะไร

ตอบ JPEG ย่อมาจาก Joint Photographic Expert Group หรือแปลเป็นไทย ๆ ของเราได้ว่า กลุ่มที่เชี่ยวชาญในงานด้านเชื่อมโยงรูปภาพนั่นเองโดย JPEG จะทำหน้าที่บีบอัดข้อมูลด้วยวิธีการใช้ค่าที่เกิดจากตารางภาพซึ่งเป็นค่าพื้นฐานที่เหมาะสม และการออกแบบการบีบอัดข้อมูลภาพนี้ผลที่เกิดขึ้นอันได้แก่คุณภาพของรูปภาพ อัตราส่วนการบีบอัดหรือเวลาที่ใช้ในการบีบอัดข้อมูลเป็นเรื่องยากที่จะสามารถคาดการณ์ได้ แต่อย่างไรก็ตามเพื่อให้ผลงานที่จะเกิดขึ้นบรรลุถึงจุดมุ่งหมายที่ตั้งเอาไว้ ต้องมีการกำหนดพารามิเตอร์แบบอัลกอริธึมที่จะช่วยให้บรรลุเป้าหมาย ซึ่งก็คืออัตราบิต (bit rate) และอัตราส่วนการบีบอัดข้อมูล

  • อัตราบิต คือค่าเฉลี่ยในการบีบอัดข้อมูล ซึ่งมีหน่วยเป็นบิตต่อพิกเซล (Bit per Pixel)
  • อัตราส่วนการบีบอัดข้อมูล คือ อัตราส่วนระหว่างขนาดของรูปภาพต้นฉบับต่อขนาดของรูปภาพที่ถูกบีบอัด ขนาดของภาพ ค่าความละเอียดของภาพ (Resolution) และจำนวนองค์ประกอบของสี เหล่านี้ล้วนเป็นตัวกำหนดถึงขนาด ในด้านหน่วยความจำของรูปภาพต้นฉบับ ส่วนขนาดของรูปภาพที่ถูกบีบอัดนั้นจะถูกกำหนดขอบเขตโดยระบบหรือการใช้งานของผู้ใช้งานเอง

    การบีบอัดข้อมูลภาพจะแบ่งออกตามอัลกอริธึมของการบีบอัดข้อมูลภาพซึ่งสามารถแบ่งออกได้ 2 แบบคือ แบบที่ไม่มีการสูญเสีย (Lossles) กับแบบที่มีการสูญเสีย (Lossy) โดยไม่ได้หมายความว่าอัลกอริธึมของการบีบอัดข้อมูลภาพของแบบที่ไม่มีการสูญเสียจะเป็นแบบที่เหนือกว่าแบบที่มีการสูญเสีย อัลกอริธึมของการบีบอัดข้อมูลภาพแบบที่ไม่มีการสูญเสียหรือ Entropy coding จะเป็นส่วนที่พยายามเก็บรักษาข้อมูลให้มีความกะทัดรัดมากที่สุดเท่าที่จะทำได้ แต่อย่างไรก็ตาม อัลกอริธึมของการบีบอัดข้อมูลภาพของแบบที่ไม่มีการสูญเสียนี้จะถูกกำหนดขอบเขตด้วย Entropy ของข้อมูลเองซึ่งจะสามารถบีบอัดข้อมูลที่มีอยู่เป็นจำนวนมากได้และจุดสำคัญคือจะมีการแยกแยะข้อมูลอย่างมีเหตุมีผล

    อัลกอริธึมของการบีบอัดข้อมูลภาพแบบที่มีการสูญเสีย จะทำงานโดยการละทิ้งข้อมูลในส่วนที่ไม่จำเป็นออกไป ซึ่งกระบวนการในแบบนี้ ก็จะทำการค้นหาแจ้งผลเกี่ยวกับความผิดพลาด (error) หรือความผิดเพี้ยน (Distortion) และอัลกอริธึมของการบีบอัดข้อมูลรูปภาพเหมือนจริงส่วนใหญ่จะเป็นแบบที่มีการสูญเสีย เพราะว่าแบบที่ไม่มีการสูญเสียไม่สามารถที่จะควบคุมข้อมูลทั้งหมดของรูปภาพให้ได้ขนาดที่เหมาะสมได้

    มาตรฐาน JPEG ถูกนิยามว่าเป็นจุดรวมของอัลกอริธึมของการบีบอัดข้อมูลรูปภาพ ซึ่งถูกออกแบบไว้สำหรับภาพสีหรือขาวดำ ภาพถ่ายเหมือนจริง นอกจากนี้ JPEG ยังสามารถที่จะบีบอัดข้อมูลวิดีโอแบบเฟรมต่อเฟรมได้อีกด้วย อัลกอริธึมที่สำคัญที่สุดในมาตรฐาน JPEG ก็คือพื้นฐานในการลำดับข้อมูล ซึ่งจะเห็นว่าการเข้ารหัสแบบ JPEG จะประกอบไปด้วยอัลกอริธึม ทั้งแบบที่มีการสูญเสียและแบบที่ไม่มีการสูญเสีย

    โครงสร้างของระบบ JPEG

    มาตรฐาน JPEG เปรียบเสมือนศูนย์กลางที่ครอบคลุมเทคนิคการบีบอัดข้อมูลด้านต่าง ๆ พื้นฐานการทำงานแบบเป็นลำดับขั้นตอน (Baseline Sequential) ที่กำลังจะถูกอธิบายต่อจากนี้ เป็นโหมดการทำงานของ JPEG ที่ธรรมดาที่สุดโดยวิธีการของมันจะใช้การเข้ารหัสแบบ Huffman และใช้แหล่งข้อมูลภาพที่มีลักษณะเป็นข้อมูลแบบ 8 บิต/พิกเซลในการทำงาน และจะไม่เกิดประโยชน์อะไรเลยถ้าหากใช้ภาพตัวอย่างที่เป็นภาพข้อมูลต่ำกว่า 8 บิต และถ้าหากจะลองทำดูก็จะพบว่าความเข้มที่มากกว่าจากพิกเซลหนึ่งจะแพร่เข้าไปสู่อีกพิกเซลหนึ่ง โดยจะส่งผลให้ได้ภาพที่มีอัตราบิตที่ไม่ดี และยังจะทำให้ได้คุณภาพของภาพที่แย่กว่าตามไปด้วย

    มาตรฐาน JPEG จะรวบรวมทางเลือกซึ่งสนับสนุนเทคนิคการแทนที่ที่เรียกกันว่า "การเข้ารหัสทางตัวเลข" (Arithmetic Coding) สำหรับใช้ในการเข้ารหัสแบบ Huffman หรือมาตรฐาน JPEG ยังรวบรวมทางเลือกซึ่งสนับสนุนการขยายพิกเซลเพื่อเพิ่มความถูกต้องของภาพคือมีการใช้ภาพขนาด 12 บิตแทนที่จะใช้ภาพที่มีขนาดเพียงแค่ 8 บิต นอกจากนี้โหมดการทำงานที่ไม่มีการสูญเสียก็เป็นทางเลือกอีกทางหนึ่งในการบีบอัดข้อมูลที่ไม่ต้องใช้การแปลงแยก cosine ออกจากข้อมูล และ JPEG ยังให้โหมดการทำงานที่ทันสมัยและมีคุณค่ายิ่งในการเข้ารหัสภาพ ซึ่งจะช่วยลดไม่ให้เกิดการถอดรหัสที่ด้อยคุณภาพตั้งแต่ส่วนเริ่มต้นของไฟล์และยังจะทำให้เกิดการสร้างงานคุณภาพที่มีความละเอียดทีละน้อยอีกด้วยโดยมาตรฐาน JPEG จะเป็นตัวกำหนดตัวแปรแต่ละตัวเหล่านี้ และเป็นเรื่องง่าย ๆ ในการพิจารณาถึงการบีบอัดข้อมูลขององค์ประกอบแบบสีเดียว มาตรฐาน JPEG จะกำหนดให้มีการบีบอัดข้อมูลแยกกันในแต่ละองค์ประกอบสี และแยกองค์ประกอบสีที่มีหลากสีในไฟล์ของการบีบอัดข้อมูลออกเป็นส่วน ๆ เพราะฉะนั้นองค์ประกอบเดียวก็เพียงพอแล้วที่จะใช้แสดงการทำงานของอัลกอริธึมของ JPEG อัลกอริธึมอันดับแรก คือการแบ่งภาพให้เป็นบล็อกภาพขนาด 8x8 พิกเซล

    หลังจากนั้นจะผ่านกระบวนการทำงานบนพื้นฐานการทำงานแบบ BLOCK By BLOCK BASIS คือจะผ่านข้อมูลเข้าสู่อัลกอริธึมตัวต่อไป ซึ่งจะเป็นอัลกอริธึมที่ทำการแปลง-แยก coxine (DCT) ของข้อมูลแต่ละบล็อก (การทำงานของ DCT จะคล้ายกับการแปลงฟูเรียร์ แต่ DCT จะเหมาะสมมากกว่าสำหรับกระบวนการแบบนี้) ข้อมูลเอาต์พุตหลังจากผ่านอัลกอริธึม DCT แล้ว จะกลายเป็นสัมประสิทธิ์การแปลงข้อมูล (transform Coefficient) ขนาดบล็อก 8 x 8 ที่ประกอบไปด้วยส่วนประกอบ DC โดยมันจะมีความสำคัญสูงกว่าส่วนอื่น ๆ ค่าในส่วนประกอบ DC จะมีค่าเป็น 8 เท่าของความเข้าเฉลี่ยของพิกเซลทั้งหมดในบล็อกนั้น ๆ และสัมประสิทธิ์อีก 63 ส่วนจะเป็นส่วนประกอบแแบ AC จำนวนตัวเลขจะทำให้เห็นความเข้มของคลื่น Cosine แบบ 2 มิติที่วิ่งอยู่ในภาคการทำงานของอัลกอริธึม DCT ที่ทำการแยก-แปลง cosine เรียบร้อยแล้ว โดยจะมีความถี่สูงขึ้นเมื่อเคลื่อนที่จากซ้ายไปขวาหรือจากบนลงล่าง อัลกอริธึมต่อไปคืออัลกอริธึมของการจัดแบ่งจำนวนภาพ โดยอัลกอริธึมนี้จะแบ่ง transfor coefficient แต่ละส่วนโดยการเรียงลำดับค่าภายในบล็อกขนาด 8x8 พิกเซลในลักษณะตัวเลขจำนวนเต็ม และเรียกกระบวนการดังกล่าวว่า "การจัดแบ่งจำนวนตารางภาพ" จากนั้นอัลกอริธึมจะทำการหมุนวนข้อมูลตัวเลขที่ถูกแบ่งและจะทำให้ได้ผลลัพธ์ของการแบ่งสัมประสิทธิ์กลังมาอยู่ในรูปแบบของบล็อก 8 x 8 พิกเซลอีกครั้ง

    ส่วนอัลกอริธึมที่เหลืออยู่ต่อไปทั้งหมดจะถูกรวมเรียกว่า "กลุ่มอัลกอริธึม" ที่ใช้ในการบีบอัดข้อมูลแบบไม่มีการสูญเสียโดยอัลกอริธึมตัวแรกของกลุ่มนี้จะทำการเข้ารหัส transform coefficient โดยใช้จำนวนของบิตที่ต่ำสุด และทำการจัดแบ่งข้อมูลออกเป็นรูปแบบซิกแซก 64 ส่วน โดยเริ่มจากส่วนประกอบที่เป็น DC และทำงานเดินหน้า-ถอยหลังในแนวทะแยงมุมกับบล็อก จุดประสงค์ของการจัดการแบบซิกแซกนี้ ก็เพื่อลดการใช้งาน Zero coefficient เป็นเวลานาน ๆ และหากมีการจัดวางความถี่ที่ต่ำกว่าไว้ในอันดับแรก และจัดวางความถี่สูงไว้ในลำดับต่อไป ก็จะพบส่วนที่เป็นค่าศูนย์จำนวนมากในตอนท้าย ๆ ซึ่งการจัดวางแบบซิกแซกสามารถแก้ไขข้อด้อยนี้ได้