Maşın təlimi əsasında işləyən “Deep Voice” adlı texnologiya 800 saatdan çox davam edən və təxminən 2400 müxtəlif səsdən ibarət səsli yazı üzərində "məşq etdirilib". Neyron şəbəkəsinin səmərəli işləməsi üçün təxminən 100 ədəd 5 saniyəlik səs siqnalı lazımdır, bu halda sözügedən texnologiya 10 ədəd 5 saniyəlik səs siqnalından sonra səsin tanınması sistemlərini aldada bilər.
Teleqraf.com “ICTnyus”-a istinadən xəbər verir ki, “Deep Voice” texnologiyası səs tembri və intonasiyanı dəqiq təqlid edir ki, bu səbəbdən onun tərəfindən səsləndirilən səslər orijinal səsdən heç fərqlənmir. Texnologiyanın yaradıcılarının fikrincə, sözügedən sistem tamamilə müxtəlif sahələrdə geniş tətbiq ediləcək. Məsələn, bu texnologiya fərdiləşdirilmiş rəqəmli köməkçilərin yaradılmasında, avtomatik sinxron tərcümə xidmətlərinin göstərilməsində, kitab, film və videooyunların səsləndirilməsində istifadə edilə bilər. Bundan başqa, neyron şəbəkəsi müxtəlif səbəblərdən danışmaq qabiliyyətini itirmiş şəxslərin həyatını asanlaşdıracaq və valideynləri ezamiyyətdə olan uşaqlara gecələr nağıl oxumaqla onları tənha qoymayacaq. Həmçinin “Deep Voice” texnologiyası səsi dəyişdirə və ya ona xarici aksent əlavə edə bilir.
"Bu, texniki baxımdan əsl irəliləyişdir – texnologiyanın yaradıcılarından biri olan Leo Zu deyib. Mürəkkəb generativ problemi həll etmək bizə nəsib oldu, yəni biz canlı nitqi ona məxsus bütün xüsusiyyətləri ilə sintezləşdirə bildik".