مستقبل الوسائط المتعددة مع تطور الذكاء الاصطناعي
إعداد:
أ. محمد الكويفي
محاضر في قسم الوسائط المتعددة بالكلية الجامعية
شهد العقد الأخير استخدامًا هائلًا لبرامج الوسائط المتعددة بسبب الازدحام الكبير في النشر على وسائل الإعلام والتواصل الاجتماعي. وكان لظهور أدوات الذكاء الاصطناعي دور كبير في توفير الجهد والوقت والمال في كافة المجالات، بالإضافة إلى السرعة في إنجاز المهام والمشاريع في تكنولوجيا الوسائط المتعددة. ولم يعد الأمر مقتصرًا على دمج النصوص والصور والصوت، بل أصبحت أنظمة الذكاء الاصطناعي (AI) قادرة على فهم هذه الوسائط وتحليلها.
لنستعرض التطورات والتطبيقات والتحديات التي تواجه هذا المجال، مع نظرة على مستقبل الوسائط المتعددة في ظل تطور أدوات الذكاء الاصطناعي.
برزت العديد من المواقع التي تحول النص إلى صورة، مما يساعد المصممين على التخيل والاستفادة من هذه الوسائل لتحسين وزيادة إنتاج الأعمال الفنية. ومواقع أخرى تحول النص إلى تعليق صوتي، بحيث يمكنك التحكم في اللغة واللهجة والسرعة وخامة الصوت. حتى شركة جوجل أعلنت قبل أيام عن تطور في أنظمة الذكاء الاصطناعي (Veo3) الذي يتيح للمستخدم صناعة لقطات ومشاهد سينمائية جاهزة بالكامل، تتضمن اللقطات والصوت والموسيقى والمؤثرات الصوتية.
أصبحت النماذج مثل (GPT-4V) من OpenAI، و(Gemini) من Google وغيرها من الشركات قادرة على دمج المدخلات النصية والبصرية والصوتية في بنية واحدة، بحيث يمكن تحليل صورة مرفقة بنص وتوليد توصيات مخصصة، مثل تحديد مقاس النظارات بناءً على صورة الوجه.
في مجالات مثل المركبات ذاتية القيادة، يُستخدم الذكاء الاصطناعي لمعالجة بيانات الكاميرات وأجهزة الليدار (LiDAR) والمستشعرات الأخرى، مما يُحسّن من دقة اتخاذ القرارات وتجنب الحوادث.
ويُستخدم الذكاء الاصطناعي متعدد الوسائط أيضًا لدمج الصور الطبية (مثل الأشعة السينية) مع السجلات النصية للمرضى، مما يوفر تشخيصات أكثر دقة واقتراح خُطط علاج فعالة.
في التعليم، تُستخدم أدوات مثل Genmo لتحويل النصوص إلى فيديوهات تعليمية تفاعلية. وفي صناعة الأفلام، تُستخدم نماذج مثل (DALL-E 3) لتحويل النصوص إلى مشاهد بصرية، بينما تُحلل أنظمة الذكاء الاصطناعي ردود فعل الجمهور عبر الصوت وتعبيرات الوجه لتحسين المحتوى التسويقي
كما يمكن لوكلاء الذكاء الاصطناعي صناعة سكريبت لأي نوع من إنتاجات الوسائط المتعددة، كالأفلام والمسلسلات والتقارير الإخبارية وغيرها، طبعًا من خلال أوامر ومعلومات تُدخلها لهذه الأداة.
من التحديات التي تواجه مستقبل الذكاء الاصطناعي أن دمج النص والصورة والصوت يتطلب تزامنًا دقيقًا لضمان اتساق المخرجات، وهو ما لا تزال التقنيات الحالية تواجه صعوبة فيه. إضافة إلى أن تدريب النماذج متعددة الوسائط يعتمد على مجموعات بيانات كبيرة ومتنوعة، مما يزيد التكلفة والتعقيد. وهناك تحدي مهم يتمثل في المخاطر الأخلاقية، كقضايا الخصوصية؛ فعمليات جمع البيانات الحساسة (مثل الصور الطبية) تُثير مخاوف حول الاستخدام غير المصرح به.
هذا التطور يُشكّل أيضًا تحديًا وتأثيرًا على سوق العمل، حيث يتوقع الخبراء أن الذكاء الاصطناعي سيؤدي إلى أتمتة 70% من المهام بحلول 2030، مما يستدعي إعادة تأهيل العمالة.
ويرى الباحثون مستقبلًا، سيعمل الذكاء الاصطناعي على تحسين التواصل البشري مع الأدوات؛ حيث ستكون واجهات المستخدم أكثر بديهية، مثل المساعدين الافتراضيين الذين يفهمون الإشارات الصوتية والبصرية معًا.
من المهم عزيزي المهتم في الوسائط المتعددة الاستفادة من أدوات الذكاء الاصطناعي وترك بصماتك الإبداعية والعمل على تجربة أدواتها في التصميم الجرافيكي، وإنتاج الفيديو، والتأليف الموسيقي، وتوليد محتوى بصري وسمعي جديد، ومواكبة الأدوات والمواقع الجديدة في مجال الوسائط المتعددة.







1 التعليقات