Sora โมเดลสร้างวิดีโอรายละเอียดสูงจาก OpenAI

20 ก.พ. 2567

Sora โมเดลสร้างวิดีโอรายละเอียดสูงจาก OpenAI

หลังจากที่ทาง Google ได้เปิดตัว Lumiere AI สุดล้ำ! สร้างวิดีโอจากข้อความ ไปเมื่อช่วงปลายเดือนมกราที่ผ่านมา เรียกได้ว่าก็ถึงเวลาที่ทาง OpenAI ได้เปิดตัวโมเดล AI Text-to-Video ของตัวเองกันบ้าง กับ Sora โมเดลสร้างวิดีโอรายละเอียดสูง จุดเด่นของโมเดลนี้คือการสร้างวิดีโอความยาวถึง 1 นาทีตามคำสั่งหรือ Prompt ที่เราระบุเข้าไป ที่แยกรายละเอียดของวัตถุกับพื้นหลังได้อย่างชัดเจน ซึ่งบอกเลยว่าถ้าเปิดให้ใช้งานจริง จะต้องสร้างคลื่นลูกใหญ่ให้กับวงการแอนิเมชันแน่นอนครับ โดยประสิทธิภาพของ Sora จะมีอะไรบ้าง พวกเรา Mercular จะมาสรุปให้ฟังกันในบทความนี้ครับ

Sora โมเดลสร้างวิดีโอ จำลองหน้าคน

สำหรับเจ้า Sora นั้นเป็นโมเดล AI ที่ได้รับการพัฒนาต่อยอดมาจากโมเดล DALL-E (โมเดลสร้างภาพจากข้อความ Text-to-Picture) และ GPT โดยการให้เรียนรู้จากฐานข้อมูลรูปภาพขนาดใหญ่ ที่จะไม่ใช่แค่เข้าใจคำสั่งจาก Prompt เท่านั้นแต่จะต้องเข้าใจฟิสิกส์ของสิ่งเหล่าต่าง ๆ ในโลกจริงด้วย ทำให้ Sora นั้นสามารถสร้างวิดีโอที่ซับซ้อน มีตัวละครจำนวนมาก ๆ ทำท่าทางที่แตกต่างกันได้ในรายละเอียดที่สูงลิบ สมจริง นอกจากนี้ยังสามารถแสดงอารมณ์ทางสีหน้า ท่าทาง รวมถึงจัดมุมกล้องต่าง ๆ ตาม Prompt ที่ป้อนเข้ามาได้ด้วย

sora-new-ai-model-from-openai-tem-1

จากวิดีโอความยาวกว่า 10 นาทีที่ทาง OpenAI ได้ปล่อยออกมาเราจะได้เห็นถึงประสิทธิภาพของวิดีโอที่โมเดล Sora สามารถสร้างขึ้นมาได้ ซึ่งไม่ได้จำกัดแค่ภาพแอนิเมชันหรือภาพที่สมจริงเท่านั้น แต่สามารถสร้างได้ถึงฉากตามวิชชวลสไตล์ต่าง ๆ ที่ต้องการได้ ซึ่งสามารถกำหนดเป็นมุมมองของฉากได้เลย ไม่ว่าจะเป็นมุมสูงจากโดรนที่บินอยู่ มุมจากกล้องที่กำลังวิ่งตามรถ หรือฉากที่ถ่ายจากกล้องฟิล์ม 3.5 mm นอกจากนี้ยังสามารถสร้างฉากตามสถานที่จริงที่ระบุลงใน Prompt ได้อีกด้วย โดยเขาได้อธิบายเพิ่มเติมว่า ไม่ได้ทำได้แค่สร้างวิดีโอ Text-to-Video เท่านั้น แต่การทำให้ภาพนิ่งขยับได้หรือยืดให้วิดีโอยาวขึ้น เจ้าโมเดลตัวนี้ก็สามารถทำได้ ซึ่งฟีเจอร์เหล่านี้ถือเป็นหนึ่งในฟีเจอร์ชูโรงของเจ้า Lumiere จากทาง Google เลยครับ เรียกได้ว่าประกาศตัวพร้อมเป็นคู่แข่งให้กับ Lumiere แบบตรง ๆ

Sora โมเดลสร้างวิดีโอ ตัวใหม่

ตอนนี้เจ้า Sora ยังอยู่ในขั้นตอนวิจัยและมีจุดบกพร่องจำนวนมาก โดยตอนนี้มันยังไม่สามารถสร้างฉากจำลองฟิสิกส์ที่ซับซ้อนได้ เช่น การกัดคุ้กกี้ ที่สามารถสร้างภาพคนกัดคุ้กกี้ได้ แต่ที่ตัวคุ้กกี้จะไม่มีรอยกัด เป็นต้น นอกจากนี้ยังมีเรื่องการรับรู้ทิศทางจาก Prompt ที่ป้อนเข้าไป จนทำให้ฉากที่ออกมาไม่สมเหตุสมผล แต่บอกเลยว่าทำออกมาได้ดีมาก ๆ โดยตอนนี้ทาง OpenAI กำลังประเมินความเสี่ยงของการนำไปใช้ในทางที่ผิด และกำลังรับฟังฟีดแบ็คจากศิลปินและคนทำหนังนอกเหนือจากคนในอยู่ จึงไม่น่าจะปล่อยออกมาให้ใช้สาธารณะเร็ว ๆ นี้ครับ และนี่คือทั้งหมดที่พวกเรา Mercular ได้นำมาบอกเล่ากันในวันนี้ เทคโนโลยีในยุคนี้ก้าวไปข้างหน้ารวดเร็วจริง ๆ เหมือนกับ Mercular ที่จัดส่งสินค้าได้รวดเร็วไม่แพ้กัน พวกเรามีสินค้าคุณภาพตั้งแต่ โน๊ตบุ๊ค เกมมิ่งเกียร์ หูฟังและลำโพง ที่ล้วนคัดสรรมาจากแบรนด์คุณภาพเพื่อคุณโดยเฉพาะ คราวหน้าจะเป็นบทความที่น่าสนใจแบบไหนอีก ก็อย่าลืมติดตามกันไว้ สำหรับวันนี้สวัสดีครับ

best-seller-ads
article-banner-1
article-banner-2