Jak mózg rozpoznaje mowę ludzką?

20/02/2014
Autor: 
Karol

Naukowcy wiedzieli już od pewnego czasu, jaka część mózgu zaangażowana jest w interpretację dźwięków mowy, ale ich wiedza na temat tego, jak ten proces przebiega, jest wciąż niewielka. Badacze z University of California w San Francisco zrobili kolejny krok, aby zrozumieć ten proces. Ich wnioski mogą przyczynić się do zrozumienia niektórych zaburzeń językowych np. dysleksji.

Zespół kierowany przez profesora Edwarda F. Changa ogłosił W Science Express (30.01.2014 r.), internetowej wersji renomowanego czasopisma naukowego Science, artykuł, w którym znalazła się sugestia, że mózg nie rozpoznaje poszczególnych fonemów (czyli – w dużym uproszczeniu – głosek), lecz bardziej elementarne ich składniki określane jako właściwości lub cechy akustyczne

Ten sposób radzenia sobie z przetwarzaniem mowy ludzkiej wydaje się być optymalny, bowiem różnice w sposobie artykulacji głosek mogą być niekiedy znaczne, w zależności od tego, kto mówi; a nawet ta sama osoba może wymawiać te same dźwięki w inny sposób przy różnych okazjach.

Na początek przyjrzyjmy się, jak powstają dźwięki mowy. Spółgłoski takie jak p, t, k, b i d wymagają od osoby mówiącej takiego ustawienia języka i warg, które spowoduje, że powietrze wydostając się z płuc napotyka na przeszkodę. Gdy przeszkoda ta zostanie usunięta, powietrze gwałtownie wydostanie się na zewnątrz i następuje krótki „wybuch”; z tego zresztą powodu językoznawcy nadali im nazwę „zwarto-wybuchowych”. Natomiast inne – takie jak s, z, w są zwane szczelinowymi, ze względu na to, że powstają one w wyniku częściowego zamknięcia przepływu powietrza, które wydostaje się na zewnątrz jakby przez szczelinę.

Ze względu na stopień skomplikowania mowy ludzkiej, wcześniejsze badania ograniczały się do analizowania reakcji mózgu na pojedyncze dźwięki generowane przez człowieka bądź komputer. W badaniach przeprowadzonych przez zespół profesora Changa postąpiono inaczej – użyto naturalnych zdań wypowiadanych przez człowieka, zawierających pełen zestaw fonemów występujących w języku angielskim.

Aby precyzyjnie śledzić aktywność mózgu w trakcie percepcji mowy, badacze przeprowadzili eksperyment podczas operacji mózgu, którym poddanych zostało sześciu pacjentów cierpiących na padaczkę. Uczestnikom badania odtworzono 500 różnych zdań w języku angielskim wypowiedzianych przez 400 różnych osób. W trakcie prezentacji nagrań rejestrowano aktywność w obszarze mózgu zwanym zakrętem skroniowym górnym, tu bowiem według wcześniejszych badań ma się znajdować ośrodek odpowiedzialny za przetwarzanie mowy (tzw. ośrodek Wernickego).

W trakcie eksperymentu udało się zaobserwować pewną prawidłowość – różne obszary w ramach zakrętu skroniowego górnego „zapalały się” w zależności od tego, z jakimi dźwiękami mieliśmy do czynienia – inne w przypadku spółgłosek szczelinowych, a inne w przypadku – zwarto-wybuchowych. Z tego wynika, że obszary zakrętu skroniowego górnego są precyzyjnie „nastrojone”, aby wyraźnie reagować na pewną prawidłowość, a nie na poszczególne fonemy takie jak b lub z. Wbrew wcześniejszym hipotezom, neurony w badanym obszarze nie zapalały się” w odpowiedzi na poszczególne fonemy lecz bardziej elementarne cechy akustyczne, które odpowiadają sposobowi, w jaki poszczególne dźwięki mowy są tworzone przez aparat mowy.

Profesor Chang porównał sposób rozpoznawania dźwięków przez mózg do poznanego wcześniej procesu, który pozwala nam rozpoznać bodźce wizualne, np. kształty, (np. rozpoznanie butelki na podstawie widzianych krawędzi i płaszczyzn.) – Biorąc pod uwagę zróżnicowanie mowy ludzkiej, które zależy od tego, kto mówi, a także w jakich okolicznościach to robi, mózg używa pewnego rodzaju algorytmu opartego na rozpoznawaniu elementarnych cech tworzących dźwięki mowy.

Chang wyjaśnia również, że jego obserwacje mogą przyczynić się do lepszego zrozumienia zaburzeń np. związanych z czytaniem, gdy np. zapisane wyrazy są w sposób niedoskonały przetworzone na dźwięki.

Poniżej znajduje się krótki film pokazujący, jak „rozświetlają się” obszary zakrętu skroniowego górnego, gdy osoba badana słyszy zdanie: „And what eyes they were.

https://www.youtube.com/watch?v=ZNsOZvEmhQc