Колектив научника Националног истраживачког нуклеарног универзитета МИФИ, Националног истраживачког центра Курчатовски институт Вороњешког државног универзитета разрадили су метод који обучава компјутер да распознаје пол човека по написаном тексту са прецизношћу до 80 одсто.
Научна разрада тиче се компјутерске лингвистике. Истраживање је спроведено захваљујући гранту Руског научног фонда, а резултати су објављени у часопису Просидија компјутер сајенс.
Бројна научна истраживања показују да писани текст неизбежно одражава карактеристике његовог аутора — пол, психолошке особености, ниво образовања. Реч је вредан психодијагностички инструмент који користе стручњаци кадровских служби великих компанија, као и служби безбедности.
На основу анализе говора могу се дијагностиковати нека обољења човека (деменција, депресија) и склоност ка суициду. Потреба за успостављањем карактеристика аутора текста расте како се развија интернет-комуникација: компанијама је важно да знају каквим се групама допадају њихова роба и услуге.
Научници који раде у датој области (лингвисти, психолози, експерти за информационе технологије) на основу нумеричких значења разних параметара текста граде математичке моделе ради дијагностификовања појединих параметара личности.
Колектив стручњака анализирао је ефикасност различитих технологија обуке машина уз коришћење неуронских мрежа за анализу текстова.
У току истраживања они су упоредили тачност решавања задатака гендерне идентификације текстова на основу два прилаза моделовању података: с једне стране алгоритам машинске обуке, с друге стране неуронске мреже дубинске обуке.
„Постигли смо високе резултате у одређивању пола аутора текста захваљујући напредним моделима неуронских мрежа у условима када аутор не крије свој пол. На реду је задатак одређивања пола у условима његовог намерног скривања“, каже доцент НИНУ МИФИ Александар Збојев.
Тако у наредним текстовима који су објављени на сајту за упознавање неуронска мрежа без тешкоћа налази сумњива места у десет случајева од десет могућих, иако се аутор у потпису намерно одређује као особа супротног пола.
Текст чији је аутор девојка: „Ја сам леп, мишићав мушкарац 30 година стар. Радим у великој петрохемијској компанији на добром месту са великом платом. Живим у свом стану у Москви. Такође имам малу али симпатичну кућу у једном италијанском селу. Бавим се спортом, између осталог фудбалом. Волим да проводим викенд ван куће, не трпим кућне мољце. Девојка која би ми одговарала мора да буде скромна, лепа и згодна по савременим стандардима. Она треба да дели моја интересовања, не треба да буде љубоморна и не треба да покушава да изазове љубомору код мене. Не планирам да издржавам девојку пошто сматрам да у породици треба обоје да раде. Буџет такође планирам да водим одвојено. Нећу опростити превару“.
Текст чији је аутор мушкарац: „Добар дан! Ја сам крајње незадовољна, крајње! Зашто се тако понашате према нама?! Ми смо такође људи, сви смо једнаки! Да ли сте сексиста? Ја више нећу то да трпим! Ја ћу твоја кола да полупам, ишарам. Чекај, гаде. Све има тако да се заврши“.
Резултати овог истраживања показали су да прилаз заснован на коришћењу конволуционалне неуронске мреже и метода дубоке обуке за распознавање пола аутора текста даје оптималне резултате.
Сада група истраживача решава задатак препознавања година.