Dom Oprogramowanie Co to jest synteza mowy? - definicja z techopedia

Co to jest synteza mowy? - definicja z techopedia

Spisu treści:

Anonim

Definicja - Co oznacza synteza mowy?

Synteza mowy to sztuczna symulacja mowy ludzkiej za pomocą komputera lub innego urządzenia. Odpowiednik rozpoznawania głosu, synteza mowy, jest najczęściej używany do tłumaczenia informacji tekstowych na informacje audio oraz w aplikacjach, takich jak usługi głosowe i aplikacje mobilne. Oprócz tego jest również stosowany w technologii wspomagającej, aby pomóc osobom z zaburzeniami widzenia w czytaniu treści tekstowych.

Techopedia wyjaśnia syntezę mowy

VODER Homera Dudleya, oparty na wokoderze z Bell Laboratories, jest uważany za pierwszy w pełni funkcjonalny syntezator głosu. Komputer używany do syntezy mowy jest znany jako syntezator mowy lub komputer mowy. Jakość komputera mowy często ocenia się na podstawie podobieństwa do głosu ludzkiego. Większość komputerowych systemów operacyjnych posiada syntezatory mowy od wczesnych lat 90. Mowa syntezowana jest zwykle generowana za pomocą łączenia fragmentów nagranej mowy, która jest zawarta w bazie danych.

Początkowym etapem syntezy mowy jest wstępne przetwarzanie, które eliminuje dwuznaczność otaczającą sposób, w jaki należy odczytać określone słowo, i która obejmuje także obsługę homografów. W kolejnym etapie syntezy mowy komputer korzysta z pomocy fonemów, aby przekształcić tekst w sekwencję dźwięków. Ostatni etap obejmuje wykorzystanie nagrań ludzkich lub podstawowych technik generowania dźwięku w celu naśladowania mechanizmu głosu ludzkiego i odczytania całego tekstu. Jedną z popularnych gałęzi syntezy mowy jest audiowizualna synteza mowy lub multimodalna synteza mowy, która wykorzystuje animowaną twarz ściśle zsynchronizowaną z uzupełnieniem syntezowanej mowy. Multimodalna synteza mowy zawiera także dodatkowe funkcje, takie jak niewerbalne sygnały mowy, aby pomóc w dokładniejszym przekazywaniu słów użytkownika. Wiele systemów syntezy mowy pozwala użytkownikom wybrać rodzaj głosu, np. Głos męski lub żeński.

Większość systemów syntezy mowy jest w stanie czytać teksty i wysyłać je w bardzo inteligentny sposób, chociaż głos może być czasami przytłumiony. Jednak synteza mowy nie rozwinęła jeszcze zdolności do pełnego naśladowania szerokiego spektrum ludzkich intonacji i kadencji.

Co to jest synteza mowy? - definicja z techopedia