Izraelskými programátory byl nedávno sestaven nový počítačový program, který dokáže určit, zda kniha byla napsána mužem či ženou.
Jednoduchý algoritmus označí slova a větnou skladbu, nesoucí stopy pohlaví autora či autorky.
Sejmutí klíčových slov a skladby je přesné na 80 %, jak u beletrie, tak u literatury faktu.
Úspěch programu zdánlivě potvrzuje stereotypní pojem rozdílů v užívání jazyka u mužů a  žen. Jednoduše řečeno, muži hovoří více o věcech, zatímco ženy rozprávějí spíše o relacích. Autorky používají více zájmen (já, ty, ona, svůj, můj), tvrdí vývojový projektant programu, Moshe Koppel s kolegy z Bar-Ilan University v Ramat Gan, Israel.
Autoři dávají přednost slovům, která označují a vymezují substantiva (nějaký, ten, který), a slova, která je určují kvantitativně (jeden, dva, více).

Takže tento článek by  pravděpodobně prozradil, z vět jako je tato, že jeho autorem je muž: Převládají zde zájmena v množném čísle (oni, jim), naznačující sklon mužů ke kategorizování spíše než k personalizování.
Kdyby článek napsala žena, pak by se v něm, jak vyplývá z výzkumů, vyskytovaly spíše věty jako je tato.
Dá se z ní předpokládat, že vy a já se podílíme na společných znalostech nebo jsme angažováni v partnerském vztahu. Tyto rozdílné styly byly již dříve označeny jako “informativní” a  “angažovaný”, podle uvedeného pořadí.

Koppel s kolegy zkoušeli svůj algoritmus na několika testovacích příkladech, aby identifikovali většinu převládajících znaků obou pohlaví, jak už bylo řečeno, u beletrie a literatury faktu. Následovně použili algoritmus k vyhledání těchto znaků v 566 dílech v anglickém jazyce od různých autorů a autorek.
Mezi jinými se jednalo o Průvodce Prahou, The Remains of the Day od Kazuo Ishiguro a román Possession od autora A. S. Byatta, jehož pohlaví kupodivu program určil chybně.
Je překvapující, že program rozliší autory od autorek na základě stejných rozdílů, které rozlišují ještě zřetelněji beletrii od literatury faktu.
Program dokáže určit tyto dva žánry s přesností na 98 %. Toto však není  překvapující, vzhledem k tomu, že literatura faktu je informativního rázu, zatímco beletrie je spíše angažovaná.
Většina studovaných děl byla vydána po roce 1975.
Izraelský tým zamýšlí prozkoumat, zda se tyto poznatky mohou aplikovat i v dalších jazycích.

Přeloženo a upraveno podle: http://www.nature.com/nsu/030714/030714-13.html    

               
Reklama