• Фото: Shutterstock
    Наука
    Среда, 12 июня 2019

    Искусственный интеллект может определять внешность по голосу

    Искусственный интеллект генерирует человеческие лица с учетом пола, этнической принадлежности и возраста, а не индивидуальных особенностей.

    Вы когда-нибудь пытались создать мысленный образ человека, которого никогда не видели, основываясь исключительно на звуке его голоса? Искусственный интеллект (ИИ) теперь может делать это, генерируя цифровое изображение лица человека с помощью одной только короткой аудиозаписи.

    Как ИИ научили воссоздавать лица по голосу

    Ученые назвали это Speech2Face. Нейронной сети, которая «мыслит» аналогично человеческому мозгу, показали миллионы образовательных видеороликов из Интернета, на которых были изображены более 100 000 говорящих людей.

    Из этого набора данных Speech2Face сформировала ассоциации между голосовыми сигналами и определенными физическими особенностями человеческого лица. Затем ИИ использовал аудиоклип для моделирования фотореалистичного лица, соответствующего голосу. Результаты были опубликованы в сети 23 мая.

    Экспресс-инфо по стране

    Земля находится на третьем месте по удаленности от Солнца и на пятом среди всех планет Солнечной системы по размеру.

    World_map_2004_CIA_large_2m (1)

    Возраст – 4,54 млрд лет

    Средний радиус – 6 378,2 км

    Средняя окружность – 40 030,2 км

    Площадь – 510 072 млн км² (29,1% суши и 70,9% воды)

    Количество материков – 6: Евразия, Африка, Северная Америка, Южная Америка, Австралия и Антарктида

    Количество океанов – 4: Атлантический, Тихий, Индийский, Северный Ледовитый

    Население – 7,3 млрд чел. (50,4% мужчин и 49,6% женщин)

    Самые густо населенные государства: Монако (18 678 чел./км2), Сингапур (7607 чел./км2) и Ватикан (1914 чел./км2)

    Количество стран: всего 252, независимых 195

    Количество языков в мире – около 6 000

    Количество официальных языков – 95; самые распространенные: английский (56 стран), французский (29 стран) и арабский (24 страны)

    Количество национальностей – около 2 000

    Климатические пояса: экваториальный, тропический, умеренный и арктический (основные) + субэкваториальный, субтропический и субарктический (переходные)

    искусственный интеллект

    Фото: Oh et. al.

    К счастью, искусственный интеллект (пока) точно не определяет, как выглядит конкретный человек, основываясь только на его голосе. Авторы исследования сообщили, что нейронная сеть распознает в речи определенные маркеры, указывающие на пол, возраст и этническую принадлежность, а также на особенности, которые свойственны многим людям.

    «Таким образом, модель будет производить только усредненные лица, — писали ученые. — Она не будет производить изображения конкретных людей».

    Слабые стороны

    Лица, сгенерированные Speech2Face — все в положении анфас и с нейтральными выражениями — не точно соответствовали людям, чей голос изучал ИИ. Однако изображения обычно иллюстрируют правильный возраст, этническую и половую принадлежность людей.

    При столкновении с языковыми вариациями ИИ тоже демонстрировал ошибки. Например, когда нейронная сеть «слушала» аудиозапись азиата, говорящего по-китайски, программа сгенерировала изображение азиатского лица. Однако, когда этот же человек говорил по-английски в другом аудиоклипе, искусственный интеллект сформировал лицо белого человека.

    Алгоритм также продемонстрировал гендерную предвзятость, связывая низкие голоса с мужскими лицами и высокие голоса с женскими лицами.

    По материалам Live Science

    Читайте также:

    Искусственный интеллект научился оживлять фотографии

    Искусственный интеллект распознает лживых туристов

    Мошенников на сайтах знакомств разоблачает искусственный интеллект