Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Litera
Правильная ссылка на статью:

Siri и навык кодирования личностных смыслов в контексте английского речевого этикета

Жикулина Кристина Петровна

ORCID: 0000-0003-2488-4616

аспирант, кафедра общего и русского языкознания, Российский университет дружбы народов имени Патриса Лумумбы

117198, Россия, Москва область, г. Москва, ул. Миклухо-Маклая, 6, кафедра, Миклухо-Маклая, 12

Zhikulina Christina Petrovna

Postgraduate, Department of General and Russian Linguistics, Peoples' Friendship University of Russia named after Patrice Lumumba

117198, Russia, Moscow region, Moscow, Miklukho-Maklaya str., 6, department, Miklukho-Maklaya, 12

christina.zhikulina@gmail.com
Другие публикации этого автора
 

 

DOI:

10.25136/2409-8698.2023.12.69345

EDN:

KZVBFU

Дата направления статьи в редакцию:

16-12-2023


Дата публикации:

30-12-2023


Аннотация: Предметом исследования является содержание личностных смыслов в вопросах или вопросах-приветствиях в контексте английских формул общения. Объект исследования – способность голосового помощника Siri к имитации спонтанного диалога с человеком и адаптация искусственного интеллекта к естественной речи. Цель исследования – выявление особенностей и уровня языковых навыков Siri в процессе коммуникации с пользователями на английском языке. Подробно рассматриваются такие аспекты темы, как проблема понимания, существующая в двух типах коммуникации: 1) между человеком и человеком; 2) между машиной и человеком; использование искусственным интеллектом устойчивых формул общения в ответах по теме «Как дела?»; определение уровня и речетворческого потенциала в ответных репликах голосового помощника. В работе использовались следующие методы: описательный, сравнительно-сопоставительный, контекстуальный, сплошная выборка и лингвистический эксперимент. Научной новизной является то, что проблемы, связанные с пониманием личностных смыслов у голосового помощника Siri, никогда подробно не исследовались в филологии и лингвистике. В связи с широким распространением и использованием голосовых систем в разных сферах социальной и общественной жизни возникает необходимость анализа ошибок в речи и описания коммуникативных неудач в диалогах между голосовыми помощниками и пользователями. Полученные материалы позволят определить роль и место искусственного интеллекта в XXI веке и сделать прогнозы о его дальнейшем языковом развитии. Основными выводами проведённого исследования являются: 1) машина не способна генерировать ответы, опираясь на опыт прошлых впечатлений; 2) отклонения от норм английского речевого этикета в ответных репликах Siri незначительные, но часто приводят к коммуникативным неудачам; 3) в ответных репликах обнаружено одностороннее кодирование личностного смысла: от машины к человеку, но не наоборот.


Ключевые слова:

голосовой помощник, Сири, искусственный интеллект, личностный смысл, коммуникация, диалог, английский речевой этикет, кодирование, разговорная речь, устойчивые формулы общения

Abstract: The subject of the study is the content of personal meanings of greeting questions in the context of English communication formulas of Siri. The object of the study is the ability of the voice assistant to simulate spontaneous dialogue with a person and the adaptation of artificial intelligence to natural speech. The purpose of the study is to identify the features and level of Siri's language skills in the process of communicating with users in English. Such aspects of the topic as the problem of understanding that exists in two types of communication are considered in detail: 1) between a person and a person; 2) between a machine and a person; the use of stable communication formulas by artificial intelligence as responses to the question «How are you?»; determining the level and speech-making potential in the responses of the voice assistant. The following methods were used in the research: descriptive, comparative, contextual, comparative method and linguistic experiment. The scientific novelty is that the problems related to encoding the personal meanings of the Siri voice assistant have never been studied in detail in philology and linguistics. Due to the prevalence use of voice systems in various spheres of social and public life, there is a need to analyze errors in speech and describe communication failures in dialogues between voice assistants and users. The main conclusions of the study are: 1) the machine is not able to generate answers based on the experience of past impressions; 2) deviations from the norms of English speech etiquette in Siri's responses are insignificant, but often lead to communicative failures; 3) the one-sided encoding of personal meaning was found in the responses: from the machine to the person, but not vice versa.


Keywords:

voice assistant, Siri, AI, personal meaning, communication, dialogue, English speech etiquette, encoding, colloquial speech, stable communication formulas

1. Введение

В настоящее время использование искусственного интеллекта (ИИ) всё чаще исследуется со стороны лингвистических аспектов, а именно анализа языка и машинной адаптации к естественной речи. Учёные надеются, что полученные результаты в этой области могут помочь в разработке инструментов машинного перевода и методов обучения машины языку. Некоторые языковые технологии уже широко применяются в голосовых помощниках, текстовых редакторах, онлайн переводчиках; ИИ способен самостоятельно придумывать тексты на разные темы, писать эссе, рефераты и курсовые работы. Популярными в использовании оказываются голосовые помощники или ассистенты, так как они охватывают разные сферы социальной жизни (банки, государственные порталы, сайты университетов) и частной жизни (умный дом, умные часы, умные колонки, ноутбуки и смартфоны).

В последнее десятилетие интерес учёных к искусственному интеллекту сильно вырос. Ведущим направлением в цифровом мире стала идея разработки искусственного разума, способного самостоятельно объяснить человеку, каким образом он пришёл к тем или иным решениям. Дэвид Ганнинг, руководитель программы разработки искусственного интеллекта в оборонных исследованиях, считает, что «любая высокопроизводительная система может оказаться одной из самых труднообъяснимых» [16, с. 10]. Его теория заключается в том, что машины способны генерировать «сложные модели реального мира, которые сам человек ещё не познал полностью» [16, с. 12], поэтому умение искусственного интеллекта изъясняться часто подвергается критике и сомнениям.

Заметим, что сложности, связанные с воспроизведением психических функций как у человека, но на электронной вычислительной машине (ЭВМ), с 1950 г. не ликвидированы. В своей диссертации «Философские проблемы соотношения мышления человека и возможностей ЭВМ в процессах решения задач» философ Ю.В. Орфеев подвергает сомнению возможность решения данной проблемы только в рамках кибернетики и компьютерных наук [12, с. 7], поэтому существует необходимость анализа возможностей искусственного интеллекта в разных научных областях, включая гуманитарные науки [13, с. 3].

Актуальность исследования заключается в том, что в настоящее время значительно вырос общественный и научный интерес к возможностям голосовых систем в области имитирования естественной речи. Голосовые помощники выступают в качестве собеседников, ассистентов в разных сферах общественной жизни. Мнения пользователей разделились. Одни обращают внимание на речевые формулы, которые использует искусственный интеллект, подмечают такие достоинства, как речетворчество, грамотность, функции распознавания речи, «рост искусственного интеллекта» [14]. Другие критикуют: 1) русские голосовые системы – «наглый и хамский тон общения», «бесполезная трата времени», «…ошибается в своих ответах», «не о чем поболтать» [14]; 2) зарубежные голосовые системы – «непонимание русской речи», «для общения с колонкой нужно иметь хорошее произношение на английском языке», «бесполезная» [15]. В связи с этим за последние пять лет написано много трудов с анализом языковых возможностей и оценкой умений искусственного интеллекта, а также с поиском различных способов интеграции ИИ в образовательный, переводческий, писательский и другие процессы. Например, в языкознании и литературоведении появились исследования, направленные на определение «коммуникативного потенциала русскоязычных и англоязычных голосовых систем» [8, с. 40]; «роли искусственного интеллекта в изучении иностранных языков» [9, с. 39]; функций искусственного интеллекта в роли «автора и соавтора литературного произведения» [11, с. 109]; сходств и различий «искусственного «интеллекта» и человеческого ума» [4, с. 746] и другие. Считается, что в 2022 г. наступила эпоха искусственного интеллекта, когда был создан первый чат-бот (ChatGPT), использующий глубокое обучение для генерации текста и ответов на вопросы. В статье «Гири и крылья искусственного разума» газеты «Московский Комсомолец» специалисты по ИИ подчёркивают, что «ChatGPT, это всего лишь одна из программ – яркое явление, благодаря которому масса людей узнала, что такое генеративные языковые модели, трансформеры, которые кто-то обучает, и они решают широкий спектр интеллектуальных задач» [3, С. 6]. Все эти факторы обуславливают актуальность изучения языковых возможностей по распознаванию естественной речи, обработке пользовательского запроса и кодирования личностных смыслов в формулах общения с человеком у голосовых помощников, так как с недавних пор они работают при помощи встроенных алгоритмов ИИ. Исследования в данном направлении помогут определить перспективы внедрения ИИ не только в частные бизнесы, но и в образовательные процессы, государственное управление и т.д. В будущем необходимость в минимизации ошибок и расширении словарного запаса, устойчивых фраз и выражений в речи голосовых систем будет стремительно возрастать в связи с расширением сфер использования голосовых помощников.

Цель исследования определила следующие задачи:

1. Провести лингвистический эксперимент для возможности описания навыков кодирования личностных смыслов голосовым помощником Siri с помощью отобранных нами вопросов и вопросов-приветствий по теме «Как дела?».

2. Провести сопоставление устойчивых формул общения в английском речевом этикете со спонтанно генерируемыми ответными репликами голосового помощника Siri на вопросы или вопросы-приветствия.

3. Определить корректность выдаваемых ответных реплик голосовым помощником Siri и отклонения от норм в английском речевом этикете.

4. Проанализировать понимание личностных смыслов, вложенных пользователем, у голосового помощника Siri с помощью контекстуального анализа.

5. Обозначить пределы языковых возможностей голосовой системы в коммуникации типа машина-человек.

Материалом исследования послужили 10 ответных реплик на английском языке голосового помощника Siri от компании Apple на 9 вопросов, сгруппированных в соответствии с речевым этикетным нормами в англоговорящей среде. Для сравнительно-сопоставительных аспектов речевых этикетных норм и контекстуального анализа были использованы примеры из онлайн-переводчика Reverso с функцией контекстного словаря; вопросы и вопросы-приветствия для эксперимента и его описания были отобраны из статей популярных онлайн-платформ для изучения английского языка: Puzzle English и Skyeng.

Теоретической базой исследования послужили труды отечественных и зарубежных учёных в области искусственного интеллекта и его развития (Пиковер, 2021); систем преобразования текста в речь (Таулли, 2021); искусственного интеллекта как «продукта технологического прогресса» (Максимов, 2021); философских проблемы соотношения мышления человека и возможностей ЭВМ (Орфеев, 1974); машиной адаптации к естественной речи (Орфеев, 1978); проблем «раскодирования контекста в ходе речевого акта» (Ефремова, 2021); системной лингвистики, где слово является «дискретным сигналом синкретической мысли» (Валентинова, Денисенко, Преображенский, Рыбаков, 2016); норм английского речевого этикета (Галибердова, 2019); бесед на повседневные темы и проблем понимания (Трейси, Роблз, 2015); особенностей светского общения (Стернин, 1996); соединения мыслительных операций и функций сознания (Леонтьев, 1975).

Практическая значимость исследования заключается в том, что с помощью полученного материала можно будет определить и проанализировать в будущем стадию прогресса или регресса голосовых помощников в таких направлениях, как имитирование естественной речи и навыки ведения спонтанного диалога у ИИ. Также материал исследования может быть использован в вузовской практике при разработке курса по программе «Прикладная цифровая филология», направленной на подготовку специалистов, использующих совместно IT-технологии и комплексы гуманитарной направленности.

2. Основная часть

2.1 Проблемы понимания личностных смыслов в коммуникациях типа человек-человек и машина-человек

Как известно, одной из ведущих проблем в коммуникации является понимание. Слова и их значения в сознании людей всегда «подвергаются неосознаваемым процессам анализа, синтеза и сравнения во время деятельности, взаимодействуя при этом с продуктами ранее воспринятых впечатлений» [19, с. 10]. Отсюда следует, что речевую деятельность и понимание можно «связать с психологическим опытом и особенностями индивида» [19, с. 14]. Как видно, даже в коммуникации типа человек-человек возникают вопросы, связанные с личностным смыслом, то есть с «субъективной окрашенностью, которая выражает значение отражаемого для самого субъекта» [10, с. 74]. Как правило, неверное истолкование личностного смысла приводит к коммуникативным неудачам. Следовательно, подобная проблема понимания существует и в коммуникации типа машина-человек, так как она зависит не только от способности голосового помощника обрабатывать текст, но и от возможности учитывать контекст.

Существует ряд исследователей, которые полагают, что искусственный интеллект в скором времени сможет приблизиться к человеческим возможностям. Например, Рэй Курцвейл, директор по инженерии в компании Google и передовой изобретатель систем распознавания текста и синтеза речи, сделал предположение, что к 2045 году произойдёт «компьютерная сингулярность, наступит мир гибридных людей: частично людей, частично машин» [18, с. 266]. Учёный публикует свои прогнозы с 1990 года, многие из них уже стали академическими.

Однако существуют и те, кто считает, что искусственный интеллект – это лишь технологический процесс, не включающий в себя речетворческий потенциал. Эксперт из Российской государственной академии интеллектуальной собственности придерживается следующего мнения: «Существующие сейчас системы искусственного интеллекта относятся к категории «слабых». Они предназначены для выполнения чётко регламентированных задач и не позволяют нам утверждать о наличии творческого ядра в происходящих внутрисистемных процессах, даже несмотря на непредсказуемость результата» [11, с. 109].

Также важно принять во внимание и то, что «слабое» развитие ИИ и, как следствие этого, описания и исследования в области коммуникации типа машина-человек могут сводиться только к анализу сгенерированной машиной ответной реплики на запрос или вопрос человека. Важно подчеркнуть, что исследуемый нами голосовой помощник Siri не реагирует на интонацию в звучащей речи, поэтому восприятие интонационных ударений и расставленных акцентов не было протестировано в данной работе.

2.2 Описание лингвистического эксперимента

Для проведения лингвистического эксперимента применялось оборудование, включавшее умную колонку Apple HomePod и планшетный компьютер со встроенными голосовыми помощниками Siri. Голосовым системам были заданы специально отобранные нами вопросы на английском языке. Необходимо уточнить, что использование данного помощника доступно в 36 странах на 20 языках. Однако в настройках Siri больше всего представлено вариантов с использованием English language: English (Australia), English (Canada), English (India), English (Ireland), English (New Zealand), English (Singapore), English (South Africa), English (United Kingdom), English (United States). Выбор языка для проведения лингвистического эксперимента был обусловлен количественным показателем модификаций с английским в конфигурации Siri. Нами был протестирован вариант English (United Kingdom) – классический английский язык, или британский вариант английского языка.

В эксперименте один и тот же вопрос задаётся голосовому помощнику до момента, пока у него не начинаются многократные повторения ответов. В ходе лингвистического эксперимента было получено 10 уникальных (неповторяющихся) ответных реплик.

Группы вопросов для Siri подобраны не случайно. В английском обществе в начале разговора принято спрашивать у собеседников «Как дела?». В большинстве случаев этот вопрос является неформальным. Например, у американцев широко распространена культура small talk, что в переводе с английского языка означает лёгкая беседа, пустой разговор или светское общение. Данная культура подразумевает под собой умение начинать и поддерживать диалоги на непринуждённые темы.

Одна из формулировок понятия светское общение принадлежит российскому языковеду И.А. Стернину, трактующему его следующим образом: «Это взаимно приятный, ни к чему формально не обязывающий разговор на общие темы, основная цель которого - провести время с собеседником, оставаясь с ним в вербальном контакте» [17, с. 4]. В поставленном нами лингвистическом эксперименте вербальный контакт тоже имеет большое значение, так как необходимо ответить на вопрос: устанавливается ли контакт между машиной и человеком с помощью речевых средств – слов? По словам начальника управления экспериментальных систем машинного обучения дивизиона общих сервисов одного из банков Сергея Маркова «в основе моделирования искусственного интеллекта лежит статистическая лингвистика, которая появилась как идея о том, что значение слова связано со статистикой и контекстом» [3, с. 6].

Следует добавить, что в речевом этикете английского языка система речевых формул в общении является устойчивой. В зависимости от ситуации собеседник выбирает конструкции для вопроса или вопроса-приветствия: в формальной и неформальной беседе, в нейтральной обстановке, в беседах со знакомыми и незнакомыми людьми [5, с. 20]. Рассмотрим отобранные нами вопросы или вопросы-приветствия типа «Как дела?», сгруппированные для проведения лингвистического эксперимента:

(1) «What’s up?» / «How is your life?»вопросы для людей, состоящих в дружеских отношениях;

(2) «How are things?» / «How goes it?»вопросы для неформального общения;

(3) «How are you?» / «How do you do?» формальные вопросы;

(4) «How are you doing?»вопрос вежливости;

(5) «How have you been?»вопрос, если давно не виделись друг с другом;

(6) «How are you holding up?»вопрос, если у человека произошло что-то неприятное.

Итак, каждая группа содержит в себе ситуативный контекст, включающий в себя прецедентные ситуации, поведенческие сценарии, культурные особенности. Предполагается, что подобная классификация поможет выявить способность к восприятию личностных смыслов у машины.

2.3 Анализ результатов лингвистического эксперимента

Зададим вопросы голосовому помощнику Siri и проанализируем: есть ли у него реакции на разные типы вопросов и вопросов-приветствий; учитываются ли машиной границы формального и неформального общения, дружеских и деловых отношений; присутствует ли у машины понимание контекста при речевом контакте с человеком.

Рис.1. Ответные реплики голосового помощника Siri на группу (1) вопросов «Как дела?» для людей,

состоящих в дружеских отношениях

1

На вопросы для людей, состоящих в дружеских отношениях, голосовой помощник Siri даёт неоднозначные ответы: Hello, how can I help? (Здравствуйте. Чем могу помочь?) (здесь и далее перевод выполнен автором статьи. – К. Ж.) и Im not sure I understand (Не уверена, что понимаю) (Рис. 1). Из полученных результатов видно, что Siri не распознаёт интерес собеседника или расположение человека к дружеской беседе. Например, вопрос How is your life? (Как дела? / Как жизнь?) остаётся непонятым системой, и все ответные реплики голосового помощника сводятся к Im not sure I understand (Я не уверена, что понимаю). Также, если Siri не понимает вопрос или не может на него ответить, она добавляет в свою реплику How can I help? (Чем я могу помочь?). Стоит проверить, реализуется ли данная функция в следующих группах вопросов и является ли это закономерностью.

Рис.2. Ответные реплики голосового помощника Siri на группу (2) вопросов «Как дела?» для неформального общения

2

Неформальные формулы общения оказываются для Siri более знакомыми и на вопросы «How are things (Как дела?) и «How goes it(Как дела? / Как проходит?) голосовой помощник даёт четыре варианта ответных реплик (Рис. 2). Три из которых (1-3) соответствуют нормам речевого этикета в английском языке – подобные речевые формулы можно встретить в любом учебнике английского для начинающих [7]. Однако ответ interesting question (интересный вопрос) не часто встречается в устойчивых речевых этикетных фразах англоговорящего общества и является более употребительной формой в общении на конференциях, собраниях, обсуждениях и т.п. – деловой английский язык. Рассмотрим несколько примеров с interesting question из онлайн-переводчика Reverso с функцией контекстного словаря:

(1) «I think you’ve raised an interesting question» (Я думаю, вы подняли интересный вопрос) [20];

(2) «President Obama: No, it’s an interesting question» (Президент Обама:Да нет, прекрасный вопрос) [20];

(3) «It is indeed an interesting question, and the short answer too it would be: freedom» (Это поистине интересный вопрос, и коротким ответом на него будет: свобода) [20];

(4)«The interesting question, then, is not about cognitive dissonance but about faith» (Интересным вопросом является вопрос не о когнитивном диссонансе, а о вере) [20].

В приведённых примерах можно увидеть ответ бывшего президента США – Барака Обамы (2), то есть политического деятеля; пример использования an interesting question в дискуссиях (3) или научных дебатах (4); а также более универсальную форму ответа, используемую как в формальных, так и в неформальных обстановках (1). В нашем эксперименте голосовой помощник Siri в качестве ответной реплики выдаёт только interesting question без пояснения или дополнительных значений – не так, как показывают употребление an interesting question примеры из контекстного словаря Reverso. Зададим Siri уточняющий вопрос: «What do you understand when you say interesting question?» (Что ты понимаешь, когда произносишь интересный вопрос?). Ответ голосового помощника: Hmm… I don’t have an answer for that. Is there something else I can help with? (Хмм… У меня нет ответа на это. Есть что-нибудь ещё, с чем я могу помочь?). Здесь стоит обратить внимание не только на то, что эта ответная реплика у Siri не привязана ни к какой конкретной речевой ситуации, но и на то, что способность машины объяснить человеку каким образом она пришла к тем или иным решениям (содержание смысловой компоненты её ответа) отсутствует.

Рис.3. Ответные реплики голосового помощника Siri на группу (3) формальных вопросов «Как дела?»

3

На формальные вопросы у Siri только один ответ – likewise (Рис. 3). В диалогах likewise часто переводят на русский язык как взаимно. В английском языке likewise является вводным словом или словом-связкой, выполняющим функцию сравнения или дополнения информации в предложениях. Например, «The meet was delicious. Likewise, the dessert was excellent too» (Мясо было очень вкусным. Более того, десерт тоже был превосходным) [1]. В этикетных формах английского языка likewise не является частотным, и больше подходит к группе вопросов (1) неформальной обстановки и дружеского общения (Рис. 1). Более того, в онлайн-переводчике Reverso с функцией контекстного словаря likewise можно увидеть больше в качестве спорадического и составного ответа, чем частотного и обособленного:

(1) «You could do likewiseif you wish» (Вы можете сделать то же самое, если хотите) [20];

(2) «And likewise for scientists and technologists» (И то же самое для учёных и технологов) [20];

(3) «You can likewisebe like him» (Вы тоже можете стать таким, как он) [20].

Из вышеописанного следует, что голосовой помощник Siri различает области формальности и неформальности в общении. Однако в ответных репликах появляется непредсказуемый и нетипичный для английского речевого этикета в повседневных беседах – likewise.

Рис.4. Ответные реплики голосового помощника Siri на вопрос вежливости «Как дела?»,

группа (4) и на вопрос группы (5), если давно не виделись друг с другом

4

Вопросы «How are you doing?» (Как дела?) и «How have you been?» (Как дела? / Как поживаешь?) оказались самыми понятными для Siri (Рис. 4). На них выдалось самое большое количество ответных реплик. Сразу стоит обратить внимание на то, что разницы между ситуативным вопросом «How have you been?» (Как дела? / Как поживаешь?) и вопросом вежливости «How are you doing?» (Как дела?) голосовой помощник не видит, поэтому выдаёт одинаковые ответы в обоих случаях.

В исследования статьи нами был поставлен вопрос об установлении вербального контакта между машиной и человеком с помощью речевых средств – слов. Согласно М.А. Рыбакову: «Слово – дискретный сигнал синкретической мысли. <…> слово, в отличие от мысли, обладает свойством отдельности. Как знак оно вычленимо из потока речи, тогда как его значение передаёт нелинейную, многоплановую, нечленимую на отдельные осязаемые сегменты мысль. Слово – компактный квант информации; знак, способный при изменении формы или даже без него получить дополнительное значение» [2, с. 24]. Если брать за основу слово как дискретный сигнал синкретической мысли, то вербальный контакт между машиной и человеком устанавливается в границах примитивного мышления, в котором представления разных видов недифференцированно связываются друг с другом. В редких случаях голосовой помощник Siri фиксирует мысли, озвученные человеком. Ответные реплики не всегда соответствуют речевой ситуации, но с помощью фиксирования отдельного слова из потока речи машина пытается подбирать контекст в пределах доступного ей языкового корпуса.

Разными цветами отмечены фразы и выражения (Рис. 4), являющиеся повторами ответных реплик в группах вопросов, описанных нами ранее (Рис. 2). Помимо повторяющихся ответов, есть и новые варианты: Im happy to be here (Счастлива быть здесь) и Im pretty good, thanks (Довольно хорошо, спасибо). Здесь в голосовом помощнике заложены устойчивые речевые формулы английского этикета, и они выдаются с соблюдением речевых норм в беседе с англоговорящими пользователями.

Обратимся к более интересной для нас ответной реплике – Hey, I cant complain. Thanks for asking (Не жалуюсь, спасибо что спросили). Можно сказать, что искусственный интеллект будто «намекает», что у него не может быть никаких проблем, поэтому ему не на что жаловаться. Хотя выражение I cant complain (Не жалуюсь / Мне не на что жаловаться) входит в список устойчивых фраз и выражений в английском языке, чаще всего оно употребляется в ситуациях, где человек обозначает свою осознанную позицию в каком-то деле или вопросе. Рассмотрим несколько примеров с I can<