أفضل 6 مولدات صوتية تعتمد على الذكاء الاصطناعي في عام 2024
تسجيل التعليق الصوتي يعد تحديًا كبيرًا. تمر بعدد كبير من المحاولات للحصول على ما تريده. ليس لديك الوقت الكافي للتمرين وضبط النغمة والنية المطلوبة. تقرأ أدلة لا نهاية لها عن برامج تحرير الصوت للتأكد من أن صوتك يبدو جيدًا. وحتى إذا قمت بإتقان كل هذه الأمور، إذا لم يكن لديك استوديو، فسيكون أداؤك المثالي مليئًا بالضوضاء الخلفية.
فهل يجب أن تتخلى وتستعين بممثل صوتي؟ ليس بعد: مولدات الصوت بالذكاء الاصطناعي يمكنها تقديم نتائج مبهرة. هذه التطبيقات النصية إلى صوت أصبحت تتحسن في الجودة والواقعية والتحكمات، مما يساعدك على إنشاء تجسيد طبيعي للنص دون الحاجة حتى لتوصيل ميكروفون بجهاز الكمبيوتر الخاص بك.
لقد قضيت بضعة أسابيع في اختبار جميع أدوات مولد الصوت بالذكاء الاصطناعي التي استطعت الحصول عليها، واستنادًا إلى تجاربي معها، هذه هي الستة الأفضل.
أفضل مولدات الصوت بالذكاء الاصطناعي
- ElevenLabs لمئات الأصوات الواقعية
- Speechify للإيقاع البشري
- WellSaid للتحكم لا
- Respeecher لتنوع الخطاب المشوق
- Altered لتنويع أسلوب السرد
- Murf للتحكم في النبرة.
ما الذي يجعل مولد الصوت بالذكاء الاصطناعي الأفضل؟
من السهل اكتشاف أفضل مولدات الصوت بالذكاء الاصطناعي: الصوت الناتج يبدو طبيعيًا وواقعيًا، تقريبًا (تقريبًا!) كما لو كان شخصًا حقيقيًا يقول الكلمات.
بجانب هذا الفحص البديهي، كل منصة تقدم مجموعة من الإعدادات التي تساعدك على توجيه التوليد، مثل النطق، النغمة، الحجم، أو السرعة. وإذا كنت تخطط لاستخدام الصوت بالذكاء الاصطناعي بالكامل، يمكنك تعلم لغة ترميز تركيب الكلام (SSML) وتحديد كيفية أداء كل كلمة بأعلى مستوى من التحكم. لا تفرط في استخدام هذه الأشياء، حيث يمكن أن تقلل من جودة وواقعية النتيجة.
معايير الاختيار
- الواقعية: هذه التطبيقات النصية إلى صوت تقدم خطابًا واقعيًا، مع تنوعات، وتغيرات طبيعية في النغمة، وتوقفات مناسبة.
- التحكمات المتاحة: التحكمات في النغمة، الحجم، السرعة، والنطق، من بين أمور أخرى، ستتيح لك ضبط التوليد وفقًا لاحتياجاتك.
- جودة الصوت: بحثت عن أعلى جودة صوت ممكنة في التصدير، بحيث يمكنك استخدام هذه الأصوات في أي مشروع.
- مكتبة الأصوات: يمكن أن تلائم الأصوات المتعددة نطاقًا أوسع من المشاريع – بما في ذلك الأصوات بلغات أخرى – بحيث يمكنك الحصول على مرونة أكبر أثناء العمل.
- الإضافات: إذا كانت أي تطبيقات تحتوي على أدوات إضافية مفيدة لتوليد الصوت، مثل الصوت إلى الصوت أو تدريب نماذج الذكاء الاصطناعي، فقد أخذت ذلك في الاعتبار. لكنني لم أدرج أي تطبيقات لتوليد الفيديو بالذكاء الاصطناعي في هذه القائمة، رغم أن بعضها يقدم النص إلى الصوت كإضافة.
ذهبت أيضًا إلى أبعد من ذلك. قبل أن أصبح كاتبًا، كنت ممثلًا لمدة عشر سنوات، وفي ذلك الوقت، أخذت ورشة عمل لمدة شهر حول التمثيل الصوتي والدبلجة. استخدمت تلك التجربة للحكم على هذه الأصوات بناءً على معايير إضافية:
- سرعة السرد: يقوم البشر بإجراء تنوعات في سرعة القراءة، وهو أمر مفيد لإضافة التأكيد أو زيادة التفاعل. عادةً ما تقوم الذكاء الاصطناعي السيئ بمساواة كل شيء، لذا انتبهت إلى النماذج التي قدمت أفضل التنوعات.
- التنغيم: يتعامل التنغيم مع تنوعات النغمة في الجمل. النماذج السيئة تجعل كل شيء متوقعًا، وروبوتيًا، وخاليًا من الحياة – تم استبعاد العديد بسبب هذا.
- الأداء العاطفي: بعض التطبيقات تتيح لك اختيار نسخ حزينة أو متحمسة أو همسية من النص. استبعدت تلك التي لم تكن دقيقة، وتؤدي النص بشكل مفرط أو أقل من اللازم. لا يزال من الصعب على الذكاء الاصطناعي تقديم أداء دقيق هنا، لذا إذا كنت بحاجة إلى شيء دقيق، فقد تفكر في العمل مع ممثل صوتي محترف.
قضيت أكثر من ثلاثة أسابيع في التسجيل لكل مولد صوتي بالذكاء الاصطناعي تمكنت من العثور عليه. استخدمت نفس النص في كل واحد منهم لتحديد الفروق بشكل أفضل. جربت التحكمات لمعرفة قوتها ومعرفة ما إذا كانت ستساعدني في تحسين النتيجة النهائية. حفظت عينات من كل تطبيق: هناك رابط لسماع مقتطف قصير من كل منها أدناه.
عند الحكم على أفضل مولد صوت بالذكاء الاصطناعي لأغراضك، ضع في اعتبارك أن جمهورك ربما سيكون منتبهًا إلى تفاصيل أخرى في محتواك أيضًا. بعض العيوب هنا وهناك مقبولة تمامًا. مع أخذ كل هذا في الاعتبار، إليك أفضل الاختيارات لهذا العام.
أفضل مولدات الصوت بالذكاء الاصطناعي نظرة سريعة
اسم الأداة | المميزات | النتائج | التسعير |
---|---|---|---|
ElevenLabs | مئات من الأصوات الواقعية | تتوفر خطة مجانية؛ وتبدأ الخطط المدفوعة من 5 دولارات أمريكية شهريًا | |
Speechify | إيقاع يشبه الإنسان | مثال على إخراج Speechify | تتوفر خطة مجانية (بدون تنزيلات)؛ تبدأ الخطط المدفوعة من 24 دولارًا أمريكيًا /مستخدم/شهر (يتم دفعها سنويًا) |
WellSaid | التحكم في تشكيل الكلمات | مثال على إخراج WellSaid | من 44 دولارًا أمريكيًا شهريًا (يتم دفع الفاتورة سنويًا) |
Respeecher | تنويعات كلامية جذابة | مثال على إخراج Respeecher | من 4 دولار شهريا |
Altered | تنوع اسلوب السرد | مثال على الإخراج المعدل | تتوفر خطة مجانية؛ وتبدأ الخطط المدفوعة من 6 دولارات أمريكية شهريًا |
Murf | التحكم في التركيز | مثال على إخراج الذكاء الاصطناعي Murf | تتوفر خطة مجانية؛ وتبدأ الخطط المدفوعة من 23 دولارًا أمريكيًا شهريًا (يتم دفعها سنويًا) |
1. أفضل مولد الصوت بالذكاء الاصطناعي للأصوات الواقعية
- ElevenLabs (تطبيق ويب)
ElevenLabs، اختيارنا لأفضل مولد صوت بالذكاء الاصطناعي لمئات الأصوات الواقعية ElevenLabs تتصدر المجموعة بمكتبة صوتية تحتوي على أكثر من 300 صوت، بما في ذلك إصدارات مرخصة من شخصيات حقيقية تعتمد على الذكاء الاصطناعي، مثل كريستي كارلسون رومانو، الممثلة التلفزيونية وشخصية كيم بوسيبول من ديزني.
مع وجود هذا العدد الكبير من الأصوات للاختيار من بينها، من الرائع رؤية أدوات البحث والتصفية الجيدة. انقر على “الأصوات” في القائمة الجانبية اليسرى ثم على علامة التبويب “مكتبة الصوت” في أعلى الشاشة. إذا قام صديق أو زميل بترشيح صوت جيد، يمكنك البحث عنه بالاسم. إذا كنت في مزاج للتصفح بدلاً من ذلك، استخدم الفئات لتصفية الأصوات بناءً على الأسلوب أو الغرض: من الأصوات الحوارية إلى تلك الموجهة للإعلانات، هناك تنوع يناسب أي نوع من المشاريع. على الجانب الأيمن من هذه الفئات، يمكنك النقر للفرز بناءً على أربع خصائص، من الأصوات الرائجة إلى تلك التي تولدت منها عدد كبير من النتائج. بجانب ذلك مباشرة، تجد المرشحات المتقدمة، وهي رائعة لعرض الأصوات بناءً على الفئة، الجنس، العمر، اللغة، واللهجة.
عندما تستمع إلى الأصوات التي تعجبك، أضفها إلى “مختبر الصوت”. سيمكنك هذا من اختيارها في أداة توليد الصوت، التي يمكنك الوصول إليها بالنقر على “الصوت”. الصق نصك أو قم بتحميل مسار صوتي، انقر على قائمة الأسماء المنسدلة لاختيار صوتك، واضغط على “توليد”. إذا لم تكن راضيًا عن النتيجة الأولى، هناك طريقتان رئيسيتان يمكنك من خلالهما التعديل:
الأولى هي باختيار نموذج ذكاء اصطناعي مختلف. كل نموذج لديه نطاق مختلف من الإعدادات، حيث يكون أحدها أفضل لتوليد متعدد اللغات وآخر للكمون المنخفض، على سبيل المثال.
ثم، بناءً على النموذج الذي اخترته، يمكنك التحكم في الاستقرار (إعداد منخفض يعني تنوع عاطفي أكثر)، التشابه (إعداد منخفض يعني اختلاف أكبر عن صوت العينة)، المبالغة في الأسلوب (الإعداد العالي يعزز التنوع بشكل عام)، وتعزيز المتحدث (يرسخ الناتج أكثر في بيانات التدريب الأصلية للذكاء الاصطناعي).
حاليًا، تُقدر قيمة ElevenLabs بمليار دولار، مما يمنحها التمويل للنمو إلى منصة توليد صوت بالذكاء الاصطناعي أكثر قوة. إنها بالتأكيد تتمتع بالمرونة والجودة لذلك، حتى لو كانت التحكمات أقل قوة من المنصات الأخرى الموجودة في هذه القائمة.
تسعير ElevenLabs: مجاني لحوالي 10 دقائق من الصوت كل شهر؛ تبدأ الخطط المدفوعة من $5/شهر (أو $50/سنة) لحوالي 30 دقيقة من الصوت وميزات إضافية مثل استنساخ الصوت.
2. أفضل مولد الصوت بالذكاء الاصطناعي للإيقاع البشري
Speechify (ويب، iOS، Android)
Speechify، اختيارنا لأفضل مولد صوت بالذكاء الاصطناعي للإيقاع البشري الإيقاع: الإيقاع هو طريقة قراءة النص، المسافات بين الكلمات، والسرعة الإجمالية. يتفوق Speechify على المنافسة، حيث ينتج في محاولة واحدة نتيجة ممتعة تشبه أداء ممثل صوتي مبدع ومتمرس. هادئ، ذو وتيرة جيدة، مع توازن جيد بين التنوع والثبات.
قد تكون الصفحة الرئيسية للموقع مربكة بعض الشيء، حيث يُعرف Speechify نفسه كمنصة لقراءة النصوص بصوت عالٍ، في الغالب لحالات استخدام الإنتاجية. يمكنك استخدامه أثناء القيادة أو التنزه في الخارج. ومع وجود أصوات متاحة مثل Snoop Dogg وGwyneth Paltrow، من الممتع الاستماع إلى قائمة مدونات التسويق الرقمي المفضلة لديك بأسلوب الأسطورة D-O-double-G.
إذا كنت ترغب في توليد وتحميل الأصوات لمشاريعك بدلاً من ذلك، انقر على الزر في أعلى الشاشة للذهاب إلى Speechify Studio. على الرغم من أنك لا تستطيع استخدام الأصوات الشهيرة – مؤسف – ستجد أن الخيارات الحالية من الدرجة الأولى. أثناء لصق النص وبدء التوليد، يمكنك زيادة أو تقليل السرعة، التحكم في النغمة، تغيير الحجم، إضافة النطق المخصص، وتحديد فترات التوقف في أجزاء مختلفة من النص.
هناك ميزتان إضافيتان جيدتان هنا. إذا كنت عادةً تنشئ مقاطع فيديو تعتمد على الشرائح، فإن Speechify يحتوي على أداة يمكنها تجميع عرض تقديمي بسيط. فقط قم بتوليد الصوت، أضف مسار موسيقى خلفية، وصدر العرض. والثانية تتيح لك إضافة صوتك إلى المنصة، بحيث يمكنك توليد الصوت باستخدام صوتك الخاص.
سعر Speechify: مجاني بدون خيار التحميل؛ تبدأ الخطط المدفوعة من $24/مستخدم/شهر (يتم الدفع سنويًا) أو $69/مستخدم/شهر (يتم الدفع شهريًا).
أفضل مولد الصوت بالذكاء الاصطناعي للتحكم كلمة بكلمة
WellSaid (تطبيق ويب )
WellSaid Labs، اختيارنا لأفضل مولد صوت بالذكاء الاصطناعي للتحكم كلمة بكلمة بينما تذهب المنصات الأخرى إلى العام، تقدم WellSaid Labs تحكمًا كاملًا في أجزاء نصك، وصولاً إلى التحكم في كل كلمة إذا لزم الأمر.
كيف يعمل هذا؟
افتح المحرر، والصق نصك. في علامة التبويب الجانبية اليمنى، انقر على “Cues” لفتح أدوات التحكم. تصبح الكلمات على الشاشة محددة: انقر على الكلمة أو مجموعة الكلمات لتحديدها، ثم اضبط الصوت أو السرعة. إذا اخترت فاصلة أو نقطة بدلاً من ذلك، يمكنك ضبط مدة التوقف.
عندما تنتهي من تحرير جزء معين، انقر في أي مكان في الجزء المركزي من الشاشة لإلغاء التحديد. ستلاحظ أن ما قمت بتحريره الآن تحت خط ملون: إذا قمت بتغيير السرعة، يكون اللون أخضر؛ إذا قمت بتحرير الصوت، يكون اللون أزرق؛ بالنسبة لتوقفات الترقيم، يكون اللون أرجواني. هذه مرجع جيد في حال أردت العودة وإجراء التعديلات. نصيحة واحدة: لا تقم بإجراء تغييرات جذرية – أكبر التنوعات هنا يمكن أن تقلل من الواقعية العامة.
التحكم في النطق
لا تكون أدوات التحكم في النطق في محرر التوليد. بدلاً من ذلك، انظر إلى القائمة الجانبية اليسرى، انقر على “Pronunciation”، وأضف بدائل النطق. ابدأ بإضافة الكلمة الأصلية، ثم اكتب كيفية نطقها بدلاً من ذلك – حتى لو كانت تهدد التهجئة. هناك منحنى تعلم وعملية تجريبية حول هذا، لذا تأكد من إلقاء نظرة على دليل إعادة التهجئة.
للاستفادة القصوى من الأدوات هنا، هناك قسم “الموارد” مع نقاط دخول إلى أهم المواضيع في الوثائق. هناك أدلة خطوة بخطوة لمساعدتك على البدء، وتحسين سير عمل توليد الصوت الخاص بك أو العمل مع النطق. وإذا كنت تتعاون مع الآخرين، يمكنك بسرعة مشاركة رابط إلى مشروع لجمع التعليقات.
سعر WellSaid Labs: فترة تجريبية مجانية متاحة؛ تبدأ الخطط المدفوعة من $44/شهر (يتم الدفع سنويًا) أو $49/شهر (يتم الدفع شهريًا).
أفضل مولد الصوت بالذكاء الاصطناعي لتنوع الخطاب المشوق
Respeecher (تطبيق ويب)
Respeecher، اختيارنا لأفضل مولد صوت بالذكاء الاصطناعي لتنوع الخطاب المشوق
مللت من سماع الصوت الروبوتي الذي يبدو كخط مستقيم طويل وممل؟ يقدم Respeecher تنوعات تجعل السرد أكثر إثارة للاستماع، مما يزيد من مدى طبيعية وواقعية كل صوت.
الجزء الأفضل هو أنك لا تحتاج إلى هندسة هذا على الإطلاق. عند إدخال نصك، يمكنك تجربة توليده بأصوات أو أساليب سرد مختلفة. سيتم تجميع كل جيل تحت الجزء المناسب من النص، مع تنوعات طبيعية في الصوت.
واجهة المستخدم غير بديهية، لذا كان من المفاجئ العثور على أدوات التحكم في التوليد مخفية بعيدًا عن شاشة المحرر الرئيسية. انقر على علامة التبويب “الإعدادات” في الجانب الأيسر وقم بتعديل معايرة النغمة، النطاق العاطفي، والخصائص الصوتية العامة. عند تغيير هذه الإعدادات، فإنها تغير جميع النتائج المستقبلية، لذا تذكر العودة إلى هنا إذا كنت بحاجة إلى شيء مختلف.
بالإضافة إلى لصق النص أو تحميل ملف صوتي، يمكنك استخدام الميكروفون لتسجيله مباشرة. في هذه الحالة، كل ما تفعله التطبيق هو تغيير صوتك ليتناسب مع القالب، مما يمنحك تحكمًا كاملاً في أداء النص. إذا كان لديك بعض الخبرة في التمثيل أو لديك مواهب طبيعية هنا، تأكد من تجربتها.
يمكنك تدريب نموذج ذكاء اصطناعي بصوتك الخاص أو أصوات الآخرين، بحيث يمكنك لعب مجموعة كاملة من الشخصيات باستخدام لوحة المفاتيح الخاصة بك. نظرًا لأن هذا قد يسهل إنتاج التزييف العميق، يجري Respeecher فحص أمني لفهم من أنت، مما يزيد أيضًا من سعر الاشتراك الشهري بشكل حاد.
لقد جربت أصواتًا متعددة مع نفس النص، وهناك شعور إبداعي أكبر هنا مقارنة بالآخرين في هذه القائمة. هذا الإلقاء وأسلوب الصوت مناسب جيدًا للرسوم المتحركة والمشاريع الأكثر غرابة. لا يعني هذا أنه محظور للاستخدام التجاري الجاد، ولكن قد يُحبط الأشخاص الذين يبحثون عن صورة رمزية تبدو أكثر احترافية. هل هذا عيب أم فرصة للتفريق عن المنافسين؟ القرار لك.
تسعير الاشتراك Respeecher: يبدأ من $4/شهر.
أفضل مولد الصوت بالذكاء الاصطناعي لتنوع أسلوب السرد
Altered (ويب، سطح المكتب)
Altered، اختيارنا لأفضل مولد صوت بالذكاء الاصطناعي لتنوع أسلوب السرد
أسلوب السرد يعمل كتغيير عام للنغمة والإيقاع لنقل شعور فريد إلى النص المولد. التطبيق الذي يحتوي على أوسع نطاق من الخيارات هنا هو Altered. إلى جانب الأسلوب، تحتوي المنصة على إمكانيات أكثر من الآخرين في هذه القائمة، لذا ستستغرق بعض الوقت لتعتاد على جميع الزوايا. لنقم بجولة عبر كل ما يمكنك القيام به هنا.
التشكيل في الوقت الفعلي يمكّن الميكروفون الافتراضي لـ Altered، تغيير صوتك الأصلي إلى صوت أحد أفاتارات الذكاء الاصطناعي في الوقت الفعلي. شيء ممتع للقيام به عندما تكون في الرابعة عشرة وتدردش عبر الإنترنت مع أصدقائك اللاعبين، ولكن البالغين المهتمين بالأعمال يمكنهم استخدامه لتسجيل هذا الصوت مباشرة في تطبيق تحرير الصوت الآخر، مما يبسط سير العمل.
التشكيل بعد الإنتاج هو اسم فاخر للتوليد الصوتي من صوت إلى صوت. أضف تسجيلًا لنص، اختر الصوت المستهدف، واضغط على توليد. قم بتنزيل النتائج، وأدرجها في مشروعك.
إنشاء الصوت السريع يتيح لك إضافة مقاطع نظيفة بطول 4 إلى 8 ثوانٍ من صوت إلى المنصة، حتى تتمكن من استنساخه واستخدامه في التوليد. (تنطبق الشروط والأحكام).
النص إلى كلام يفتح المحرر المتوقع لإدخال نصك واختيار صوتك. تعتمد أساليب السرد على الصوت الذي تختاره، لذا انقر عبر كل منها لرؤية الاختلافات الرئيسية. تتنوع الإمكانيات هنا بين “فقط أقل من الطبيعي” للثبات إلى “إيجابي، صراخ” للتأكيد والطاقة. ضع في اعتبارك أنه اعتمادًا على النص والنغمة التي تختارها، قد تكون النتائج غير متسقة، غريبة، مضحكة، أو كل ما سبق.
أخيرًا، يحتوي Altered أيضًا على محرر صوتي بكمية كبيرة من التحكمات. يمكنك تحميل الصوت الخاص بك – أي نوع من الصوت – والوصول إلى النسخ، توليد الكلام، أو إزالة الضوضاء، بين العديد من الإمكانيات الأخرى. منحنى التعلم هنا حاد بعض الشيء، حيث أن هذه الشاشة تعطي إحساس محرر صوتي حقيقي: تأكد من فتح المستندات واستخدامها كرفيق.
سعر Altered: خطة مجانية محدودة متاحة؛ تبدأ الخطط المدفوعة من $6/شهر.
أفضل مولد الصوت بالذكاء الاصطناعي للتحكم في التأكيد
Murf (ويب)
Murf، اختيارنا لأفضل مولد صوت بالذكاء الاصطناعي للتحكم في التأكيد جرب هذا التمرين البسيط للمبتدئين في التمثيل: اختر جملة من هذه المقالة، واقرأها بصوت عالٍ. ثم كررها مع التأكيد على كلمة مختلفة في كل مرة. أثناء القيام بذلك، لاحظ كيف يتغير معنى وإحساس الجملة بأكملها. يتيح لك Murf القيام بذلك لأصوات الذكاء الاصطناعي المولدة.
زر التحكم في التأكيد سهل الفقدان. عند العمل على مشروع، ابدأ بإضافة نص إلى الكتلة الأولى. أثناء القيام بذلك، انظر إلى الأيقونة على يسار زر التشغيل – تبدو كأيقونة تعليق – وانقر عليها. يظهر نافذة منبثقة مع تسلسل لجميع الكلمات في تلك الكتلة، بمقياس عالي-متوسط-منخفض: انقر في أي مكان لإضافة نقطة. المكان الذي تنقر عليه يهم، لذا جرب إضافة النقاط في محاور اليسار/اليمين والأعلى/الأسفل.
بجانب هذه التحكمات، يمكنك تعديل السرعة والنغمة العامة، إضافة توقفات، أو إضافة نطق مخصص. إذا اخترت صوت Ken، ستتمكن أيضًا من الوصول إلى أوسع نطاق من أساليب السرد، بما يصل إلى تسعة، من سرد القصص إلى الحزن. جربت إعداد البكاء متوقعًا نتيجة سيئة ولكن فوجئت بالتمثيل الدقيق. عمل جيد، Ken.
عند النظر إلى أسفل الشاشة، يمكنك توسيع الجدول الزمني لكشف المزيد من الميزات. يمكنك إضافة الفيديو والموسيقى مباشرة إلى المنصة لإنتاج المحتوى وتصديره مباشرة من Murf AI، جاهز للمشاركة. مع تقدم استراتيجية المحتوى الخاصة بك، يمكنك دعوة زملائك والتعاون في مشاريع توليد الصوت: يمكن لأي شخص ترك تعليقات على كل كتلة نصية، بحيث يمكنك الاستمرار في التعديل حتى تصل إلى أفضل نتيجة ممكنة.
كلمة أخيرة من النصيحة: الأصوات في الخطة المدفوعة تبدو أفضل بكثير من تلك في المستوى المجاني. إذا كنت جادًا بشأن توليد الصوت وتحب تحكمات Murf AI، فكر في الاستثمار في وقت قريب.
سعر Murf: مجاني لتوليد 10 دقائق من الصوت و2 من المشاريع؛ تبدأ الخطط المدفوعة من $23/شهر (يتم الدفع سنويًا) أو $29/شهر (يتم الدفع شهريًا).
هل لدى OpenAI نموذج لتوليد الصوت بالذكاء الاصطناعي؟ نعم، مبدعو ChatGPT في اللعبة. الطريقة الوحيدة لاستخدام تحويل النص إلى كلام في OpenAI هي عبر API، مما يتطلب بعض المعرفة التقنية لإعداده.
لديهم أيضًا نموذج استنساخ صوت بالذكاء الاصطناعي يقال إنه قوي جدًا لدرجة أنه غير متاح للاستخدام العام. (مرعب). لا يوجد تقدير لموعد ظهور نسخة تجارية. اقرأ المزيد في المنشور الرسمي على المدونة حول التحديات والفرص للأصوات الاصطناعية.
هل الأصوات التي يتم توليدها بواسطة الذكاء الاصطناعي قانونية؟
جميع المنصات المذكورة في هذه القائمة تقدم مجموعة من الأصوات التي تم إنشاؤها عن طريق ضبط بيانات التدريب أو نمذجة صوت شخص حقيقي بموافقته. استخدام هذه الأصوات قانوني، بشرط الالتزام بشروط الخدمة والترخيص الخاصة بالتطبيق الذي تستخدمه.
تكمن المشكلة الرئيسية في استنساخ الصوت بالذكاء الاصطناعي. مع بضع عينات فقط من صوت شخص حقيقي، يمكن لأي شخص ضبط نموذج ذكاء اصطناعي للتحدث مثل أي شخص – بما في ذلك الأشخاص المشهورين. وايضًا، بما في ذلك أنت. يمكن أن يؤدي إنشاء واستخدام هذه الأصوات المزيفة إلى سرقة الهوية، والتلاعب، والمعلومات المضللة، والابتزاز، أو انتهاك قوانين حقوق النشر (عند الحديث عن الفنانين وأعمالهم).
اعتمادًا على مكان وجودك في العالم، قد تكون هناك تشريعات للتحكم في هذه الأنواع من الاستخدامات، مما يعني أن هناك عواقب قانونية إذا لم يتم الحصول على الموافقة أو إذا تم استخدام الصوت بنية إجرامية – أو بطريقة يمكن تفسيرها على هذا النحو. إذا كنت تستنسخ صوت شخص آخر وتستخدمه للتوليد بالذكاء الاصطناعي، تأكد دائمًا من الحصول على موافقته (يفضل أن تكون مكتوبة) قبل استخدام النتائج.
التحدث بدون تعليق صوتي
مع مولد الصوت بالذكاء الاصطناعي، يمكنك تحويل النصوص إلى سرد متدفق، جاهز للإضافة كتعليق صوتي على فيديو، دون الحاجة إلى عشرات المحاولات ودون الحاجة إلى فريق إنتاج.
جميع المنصات في هذه القائمة توفر طرقًا لتجربة الميزات والأصوات، لذا اختر إحدى نصوصك وأجرِ اختباراتك. من المهم أيضًا العثور على منصة تحتوي على تحكمات تتوافق معك، لذا خذ بعض الوقت للشعور بكيفية عمل كل واحدة. الآن بعد أن أصبحت تستطيع التحدث باستخدام لوحة المفاتيح فقط، ماذا ستنشئ بعد ذلك؟
مرحبًا، هذا تعليق.
للبدء بالإشراف، التحرير، وحذف التعليقات، من فضلك قم بزيارة شاشة التعليقات في لوحة التحكم.
صورة المُعلق تأتي من Gravatar.