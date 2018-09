11 сентября, 2018, 18:06

Бразильские программисты пришли к выводу, что нейросеть Google Translate предвзятая при переводе участков текста без грамматической категории рода

Как говорится в статье, опубликованной на arXiv.org, такие выводы ученые сделали на основе анализа алгоритмов сервиса.

Ученые из Федерального университета Риу-Гранди-ду-Сул под руководством Луиса ламба ввели фразы на 12 языках, в которых полностью отсутствует грамматическая категория рода - в том числе на венгерском, финском, суахили, йоруба, армянском и эстонском, составив на этих языках предложения с безродовым местоимением и профессией.

Оказалось, что предложения с отсутствием рода Google Translate переводил по-разному - у egy ápoló (он / она медсестра) превратились в "she is a nurse", а у egy tudós ( он / она ученый) перевелось как "he is a scientist".

Оказалось, что переводчик в 71% случаев относит технические профессии к мужскому роду, а к женскому только в 4%. Остальные случаи Google Translate относит к среднему роду.

На основании данных BLS, участие женщин во всех профессиях составляло 35,94%. Одним словом, переводчик Google больше говорит о мужчинах, чем о женщинах.

"Наши результаты показывают, что мужчины "автоматически" не только выдающиеся, но и преувеличены в сферах, где господствуют гендерные стереотипы, такими как работа STEM (наука, технология, инженерия и математика)", - говорится в документе.

Дальнейшие доказательства алгоритмического предубеждения, которые можно назвать неспособностью компенсировать культурный фаворитизм, появились в ассоциациях определенных прилагательных с определенными гендерными местоимениями.

Выражения со словами "привлекательные", "застеснялись", "счастливые", "добрые" и "застенчивые", как правило, переводятся с местоимениями у женщин. Выражения со словами "заносчивыми", "жестокими" и "виновными" были переведены мужского рода.

