Řeč z obrazu

5.8.2014

Algoritmus, s jehož pomocí lze z chvění předmětů zachycených na videu rekonstruovat zvuk, který tyto kmity vyvolal, vyhotovili experti z MIT, Microsoftu a Adobe pod vedením prof. Frédo Duranda a prof.Billa Freemana z MIT. Pochopitelně museli použít použít vyšší rychlost snímání, než je frekvence zvukových vln (16 - 20.000 Hz). Ukázalo se, že 6.000 obrázků za sekundu postačí pro srozumitelnou rekonstrukci zvukového signálu. Je to stokrát více než dosahují standardní smartphonové kamery. Nejrychlejší na trhu dostupné kamery pracují s rychlostí až 100.000 snímků za sekundu, takže nebylo třeba sáhnout po top technologii. Ze snímků pytlíku s bramborovými lupínky, které pořídili ze vzdálenosti 4,5 m skrz zvukotěsné sklo, zrekonstruovali srozumitelnou řeč. Informaci o chvění získali pomocí série filtrů, které zachycovaly barevné změny rozhraní v různých orientacích a měřítkách. Jejich vektorovým skládáním vzniká zvukový signál. Popis technologie v anglickém jazyce a ukázky rekonstruovaných zvuků najdeme na tomto videu. Nepochybně jde o špičkový intelektuální výkon, ale zároveň o další hřebíček do rakve našeho soukromí.

 
Odeslat komentář k článku "Řeč z obrazu "



Opište text z obrázku:

Odeslat článek "Řeč z obrazu " e-mailem

Diskuse/Aktualizace