Компьютер обогнал китайца

Система искусственного интеллекта распознает китайский текст лучше человека

Яна Хлюстова

Shutterstock

Создана компьютерная система, которая распознает рукописный китайский текст эффективнее человека. Отдел науки «Газеты.Ru» рассказывает о других достижениях искусственного интеллекта, которые могут облегчить нашу жизнь.

Пишут так, что только компьютер разберет

На минувшей неделе была представлена система искусственного интеллекта, которая способна распознавать рукописный китайский текст. Само по себе это достижение неново: существует множество приложений, в том числе и со встроенными словарями, которые делают то же самое и существенно облегчают жизнь студентам, изучающим китайский язык. Подобные программы устанавливаются на смартфон с камерой, после чего владелец наводит объектив на текст, приложение «расшифровывает» его и автоматически вставляет иероглифы в словарь.Однако у подобных программ есть существенный минус: чаще всего они способны считывать только печатный текст. Написанные от руки китайские иероглифы отличаются от стандартизированного компьютерного шрифта так же сильно, как шрифт Times New Roman от рецепта, написанного непонятным почерком врача.

Рецепт, выписанный китайским врачом Gaoxiao

Однако корпорации Fujitsu удалось решить эту проблему:

ее сотрудники разработали систему искусственного интеллекта, которая распознает рукописный китайский текст с эффективностью 96,7%. Человек делает это несколько хуже — для людей этот показатель равен 96,1%.

Подробнее ознакомиться с описанием системы можно на сайте ее создателей.

Работу над созданием технологии компания начала еще в 2010 году. В 2013 году первые результаты были представлены на самой престижной конференции по компьютерному распознаванию текстов и изображений International Conference on Document Analysis and Recognition. Тогда эффективность расшифровки рукописного китайского текста достигала 94,8%, что на тот момент стало рекордным показателем.

Функционирование системы искусственного интеллекта основано на следующем принципе: сначала она считывает общий вид иероглифа, распознавая его основные черты. После этого в дело вступает следующий «слой» электронных нейронов, которые «всматриваются» в детали символа. Особенность этого процесса заключается в том, что анализ иероглифа происходит как бы в трех измерениях: высота картинки, ее ширина и распознавание градации серых тонов.

Принцип работы системы искусственного интеллекта Fujitsu

Для того чтобы научить систему делать это, ученым пришлось увеличить число искусственных нейронных связей с 2,8 млн (показатель 2013 года) до 150 млн. Благодаря тому, что искусственный интеллект теперь может видеть вариации в цвете разных черт иероглифа, он способен создать трехмерную картинку иероглифа и оценить степень искажения черт, сравнив с наиболее похожим стандартным изображением.

Поделись улыбкою своей

Системы искусственного интеллекта способны считывать не только статичные тексты и изображения — исследователи из Малайзии смогли научить компьютер разбираться в значениях человеческой улыбки. Отчет о своем достижении они опубликовали в The International Journal of Artificial Intelligence and Soft Computing.

Система искусственного интеллекта оказалась способной отличить друг от друга улыбки, выражающие счастье, грусть, злость, отвращение, страх, удивление, а также идентифицировать нейтральную улыбку. Компьютер при этом анализировал форму верхней и нижней губы по отдельности.

«В последние годы наблюдается все возрастающий интерес в улучшении всех аспектов взаимодействия между людьми и компьютерами, а особенно в улучшении способности компьютера определять эмоции человека, основываясь на выражении его лица», — комментирует ведущий автор исследования Картигаян Мутукаруппан. Ученые сосредоточились на изображениях губ человека, потому что именно наш рот является самым ярким выразителем эмоций.

Компьютер учится сам

Если предыдущему изобретению, судя по всему, еще предстоит ждать своего часа, до тех пор пока не будут изобретены общедоступные «умные» операционные системы (наподобие той, что фигурирует в фантастическом фильме «Она»), то ученые из Гетеборгского университета создали систему искусственного интеллекта, которая может принести пользу уже сейчас.

Исследователи разработали программу, которая способна имитировать процесс обучения маленьких детей.

Она осваивает базовую арифметику, грамматические правила и основы логики с нуля, руководствуясь теми же принципами, что и дети.

В качестве примера такого обучения создатели системы описывают следующую ситуацию. Допустим, ребенок осваивает умножение. Если он знает, что произведение двух и нуля — так же как трех и нуля — равно нулю, то может прийти к выводу, что умножение семнадцати на ноль также даст ноль. Но подобная логика иногда подводит: знание того, что произведение двух нулей равно нулю, а произведение двух единиц — единице, может привести к ошибочному заключению, что два, умноженное на два, также даст двойку. Ребенок — как только понимает, что пошел по ложному пути, — отказывается от такой логики и ищет новые способы решения задачи. Точно так же работает и система искусственного интеллекта. Подробнее с описанием ее функций можно ознакомиться на сайте Гетеборгского университета.

Авторы исследования полагают, что их изобретение может применяться для создания мультизадачных роботов, выполняющих разнообразные задачи по дому.