יוצרים מודל AI עם קול

תגיות - AI, VOICE
פברואר 7, 2024

קודם כל אמרתי לה לא. יש אנשים שמתמחים בAI המתקדמת יותר, אני – מתעסקת בבינה מלאכותית ידידותית ופשוטה למורים, חינמית, ואיך להוציא ממנה מקסימום. נתתי לה שמות של אחרים, מסתבר שהם עסוקים. טוב, ננסה!

המשימה: להשמיע משפט משימה מתוך מרכז למידה, בקול של לא אחר מאשר הרב מרדכי אליהו זצ"ל, דמות החמ"ד של השנה, הרב הראשי, וגם הרב שאותו שאלנו על שמות הילדים, וביקשנו את ברכתו עבור הבן שלי כשנלחם על חייו בפגיה. לא אספר פה על הניסים, מי שרוצה- בפרטי. "צמד חמד" בנו מרכז למידה מושקע ויצירתי על דמותו, ורצו להוסיף מגע אישי. איך אפשר לסרב?

אז יש כאן שתי משימות:

לאמן מודל, כלומר לתת חומר גלם של הקלטות איכותיות לAI שיידע להרכיב ממנו פרופיל קול דיגיטלי של הדמות הרצויה.
לתת למודל קלט של משפט, שאותו הוא מרנדר (מייצר) ומלביש על מודל הקול שיצר בשלב 1.

KITS AI עושה את שתי המשימות.

את 2 – אפשר לקבל בחינם עד 15 דקות בחודש, על דמות מהמאגר אצלם.

אם רוצים לאמן קול חדש- צריך לשלם (9.99$), ואז יש 60 דקות בחודש של פלט.

איך מתבצע אימון המודל?

(אחרי ששילמנו על מנוי) בוחרים אימון מודל. מעלים כמה קטעי קול – נקיים, כמה שפחות רעשי רקע, בלי הכפלות ואפקטים מוזיקליים עד כמה שאפשר. אפשר להעלות אותם כקבצים, או – לתת לינקים לכמה קטעי וידאו קצרים מיוטיוב.

התהליך מתקיים ברקע, ולוקח כמה שעות. אפשר להוסיף למודל שלכם תמונה.

והנה, המודל שלי מוכן.

איך מייצרים משפטים בקול שיצרנו?

נלחץ על "השתמש בקול".

נכניס קלט מצידנו, וכאן יש כמה אפשרויות.

טקסט לדיבור- אפשר לכתוב משפט, והמערכת מייצרת את הדיבור. זה כמובן יותר רובוטי.
מאודיו לדיבור: אפשר להקליט, להעלות קובץ, לתת לינק ליוטיוב או להשתמש בקטע אודיו חופשי לשימוש. זה מהווה הבסיס, שעליו המערכת תלביש את הקול. כאן שמתי לב שכדי להגיע לקול שבאמת נשמע כמו הדמות המקורית, צריך בקלט הזה לחקות אותו ככל האפשר – הבינה המלאכותית נותנת רק את הקול הבסיסי, ולא את המבטא, הדגשים, אותיות כמו ח' וע', קצב וכולי. כלומר, אנשים שיודעים ליצור חיקוי טוב, יצליחו להוציא מהמערכת תוצאות טובות יותר ומשכנעות יותר.

הנה הדוגמא הראשונה, לפני שהבנתי שצריך לתת מבטא וביטוי: