imagazin arrow2-left arrow2-right arrow2-top arrow-up arrow-down arrow-left arrow-right cart close dossiers education fb instagram menu notification oander rss rss-footer search service shuffle speech-bubble star store stores tests twitter youtube

Otestovali jsme iPhone XS Max

Podívejte se, jak se nám líbil po dlouhodobém testování!

Nevíte, jestli Laurel, nebo Yanny? Odkryjeme vám pravdu


Po čase nám zase explodoval internet. Tentokrát se otázka netýká barvy šatů, ale stroje říkajícího Yanny, nebo Laurel. Celý svět je nyní rozdělený na dvě skupiny, pojďme se pomocí vědeckých nástrojů pokusit lidstvo opět spojit.

Nová vlna během chvíle rozcupovala internet, tentokrát se bavíme o fenoménu Yanny vs. Laurel. Jestliže jste se dosud úspěšně vyhýbali, potřebujete trochu uvést – na webu se objevila několikasekundová nahrávka ze zvukového syntetizátoru, z níž jedna skupina slyší jedno slovo, druhá zase jiné. Záhadou k vyřešení je, které slovo je správné. První část lidí se pere za fakt, že slyší slovo Laurel, druhá pak, že slyší Yanny.


Jistě si vzpomenete na něco podobného, co se před časem provalilo webem. Tehdy se dvě skupiny hádaly o tom, zda jsou šaty modré, nebo zlaté. Tehdy vás šálil zrak, tentokrát sluch.

Mezinárodní média se rozhodla k problematice přizvat odborníky. Měli různé názory, které však vedly jedním směrem, jenž by nás opět mohl spojit. Místo toho, abyste se museli pokusit najít odpověď sami, představíme vám ve článku všechny úhly pohledu, které musíte brát v potaz.

Priming

V psychologii a dalších vědách vědci narážejí na takzvaný priming. Priming označuje kognitivní proces, při kterém podnět z dřívějška ovlivňuje pozdější chování a myšlení jedince, například to, jak později vnímá podobný podnět.

Když nejde o zkoumání efektu a vědci nechtějí, aby priming negativně ovlivňoval další výsledky, musí si dávat pozor. Sami si můžete vzpomenout na známou formu, kdy působí perfektně:

A: Bílá, bílá, bílá, bílá, bílá…
A: Co pije kráva?
B: Mléko!

Obličeje, nebo váza?

Ten, kdo reaguje instinktivně, odpoví přesně takto. Jde o to, že si v hlavě spojíme bílou barvu (a samotnou krávu) s mlékem a následně tíhneme k rychlé odpovědi. Mentální přístup je rychlejší k mléku jako k řešení, než jak je tomu u vody čili správné odpovědi.

Priming se odehrává podvědomě. Stejně jako podprahové reklamy na Coca-Colu v podobě snímků nastříhaných do filmu. Jde o typ primingu, kde stimul nedosáhne vašich limitů, ale podvědomě jej vnímáte. U příjemce se prostě odehraje.

V případě Laurel-Yanny je rozhodujícím faktorem to, jak „čerství“ jste byli, když jste nahrávku slyšeli. Jestliže za vámi přišel kamarád se slovy: „Hele, pojď si něco poslechnout, já tam slyším jen Laurel, co ty,“ tak jste takovém případě ovlivněni primingem a od teď uslyšíte jen Laurel, i kdybyste za normálních okolností slyšeli Yanny.

Mezi kmitočty

Možná si ještě vzpomenete na naše články o zvuku. Pokud ne, můžete si je rychle pročíst.

V případě sluchu se bavíme o cítění fluktuace tlaku vzduchu. Vše se odehrává skrze šíření vln, jež mají jiné frekvenční parametry.

Když mluvíme, máme kvůli biologické podobě našich orgánů různou rezonanční charakteristiku. Jako bychom byli kytarami z různých materiálů a s různými tvary. Jak snadno rozpoznáte zvuk kytary, stejně snadno poznáte zvuk lidského hlasu.

Naše vlastní rezonance občas posílí a jindy oslabí zvuky o různých frekvencích, které vydáváme pomocí hlasivek, skrze ústa (a/nebo nos). Tomu říkáme formant. Formanty v sobě mají informaci, porovnávají se i navzájem. Například souhlásky snadno popíšeme pomocí dvou prvních formantů (F1 a F2). Jejich konkrétní hodnoty tvoří takzvaný samohláskový trojúhelník, kde jsou konkrétní formanty jednotlivých souhlásek vypsány.

Jednou z příčin fenoménu je tak i fakt, že lidé mají rozdílný rozsah sluchu – ti, kteří vyšší frekvence slyší hůře, slyší slovo Laurel, ostatní pak Yanny. Přesný rozsah lidského sluchu je mezi 20 a 20.000 Hz. O dobře rozpoznatelném rozsahu se bavíme někam do 8.000 Hz, vyšší zvuky už pro nás mají jen drobné rozdíly.

Před příchodem nových generací sítí měly mobilní telefony omezený rozsah jen mezi 300 a 3.000 Hz, přesto jsme si jasně rozuměli. Frekvence výše zmíněných prvních dvou formantů je totiž nižší než 3.000 Hz. Snadno jsme tak mohli rozpoznávat souhlásky.

Zde by se mohl skrývat klíč k rozluštění záhady. Aby člověk nedokázal správně slyšet u tohoto rozsahu, musel by mít vážné problémy. Jestliže je však kmitočet zvuku přesně na hranici, můžete očekávat něco jako nyní. V tomto případě ale možnost není úplně zřejmá, jelikož jsou obě slova zcela jiná: [jæni] (= Yanny) a [lɔrəl] (=Laurel)

Analýza hlasu

Skrze různé frekvence a priming můžete jednoduše oklamat svůj sluch a mozek. Je těžké určit, za jakých podmínek člověk nahrávku poslouchal a co jej v tu chvíli ovlivňovalo. Je potřeba objektivní pohled na věc, v tu chvíli přichází analýza hlasu.

Bez zbytečného zacházení do detailů vám rovnou přinášíme hotovou analýzu zvuku.

Je důležité podotknout, že pro správné fungování analytického softwaru je nutné nahrát zvuk v co nejvyšší kvalitě. Aktuální nahrávka je v relativně špatném stavu, což může výsledek ovlivnit.

Prvním krokem bylo stažení nahrávky z internetu a konverze do správného formátu. Následně jsme zvuk nahráli do našeho kamaráda Praata, softwaru pro analýzu zvuku. Program nám dal následující výsledek:

Jak vidíte, nahrávka má dost šumu. Obsahuje ruchy v pozadí a klikání myší. Software sice obsahuje možnost potlačování okolního hluku, ale pouze na takových frekvencích, kde by to celý výsledek zkazilo. Museli jsme tedy možnost vynechat.

Přiblížením na konkrétní části jsme začali hledat různé zvuky řeči. Jak Yanny, tak Laurel začínají něčím, co označujeme jako aproximační tón. Jediným rozdílem je, že [j] je mediální aproximant, zatímco [l] je alveolární souhláska laterální. Vzhledem k minimálnímu rozdílu je tón v obou případech velice podobný a se záznamem podobné kvality je nelze rozlišit.

Mnohem evidentnější je obrovský kráter uprostřed měření, který je vidět při oddálení. Můžete zde vidět formanty (linka z červených teček), jež se shlukují směrem k jednomu bodu. Zvukové tóny tak vysávají všechny formanty. To je klasickým znakem zvuku [r]. Oproti tomu by se [n] od samohlásek mnohem méně odlišovalo.

Důkaz zvuku [r]
To je bod pro Laurela. Nyní přichází další – jde o [i] na konci Yanny. Jestliže jde o samohlásku, můžeme očekávat opakující se znaky [i], v tomto případě vysoké hodnoty F2 a nízké u F1. Program však žádnou periodicitu neobjevil. Přestože je vzdálenost mezi formanty relativně velká, program spočítal hodnotu F1 přes 500 Hz, což je na zvuk [i] až příliš vysoké. Do jisté míry to však může kazit okolní šum.

Více odhadů na základě této nahrávky nelze udělat, protože je jednoduše v příliš špatné kvalitě. Podle našeho skromného názoru je problém založený právě na okolním šumu. Maskuje totiž některé klíčové akustické znaky, jež nám brání v rozdělení těchto dvou slov.

Není zde potřebná periodicita pro zvuk [i]
Podle našeho sluchu a softwarové analýzy bychom si vsadili na slovo Laurel. V redakci se však najde i mnoho zastánců slova Yanny. Nakonec stejně rozhoduje to, co slyšíte, a ne analýza zvuku.

Zdroj: Wikipedia
iMac Pro
Apple Inc. (AAPL)

Tohle už jste četli?

Nový systém se zaměřuje především na dvě oblasti: na uživatelský zážitek a na výkon. Z pohledu výkonu staví na novém frameworku Metal, který Apple již dříve přinesl na iOS. Metal kombinuje schopnosti technologií OpenGl a OpenCL do jednoho prvku.