#Ошибки_нет. Айти не знаю, как перевести, или Вторая часть приключений гуманитария в цифровом мире

В первой части материала его автор – магистрант программы «Журналистика данных» в Тольяттинском государственном университете Евгений Стёпочкин исследовал языковые явления с помощью цифровых технологий. В новой серии он узнаёт, как менялись со временем значения знакомых слов, и привлекает в соавторы текста нейросеть.

 

Слова, слова, кругом слова

Есть целая плеяда слов, которые русский язык благополучно апроприировал. Классический пример – «ксерокс». Изначально это название торговой марки копировальной техники, которая была едва ли не единственной на российском рынке. Потом пришли конкуренты, но в массовом сознании любой копировальный аппарат теперь называется ксероксом. Похожая история с «джипом», «кедами», «памперсами» и множеством других слов.

А вот ещё одно слово, которое прочно вошло в наш обиход. Глагол to google ещё четверть века назад был в новинку даже для английского языка. Первым, кто использовал слово как глагол, был соучредитель Google Ларри Пейдж, 10 июля 1998 года подписавший одно из своих сообщений для списка рассылки «Have fun and keep googling!». А в 2010 году американское диалектическое сообщество даже назвало глагол to google словом десятилетия.

«Гуглить», как и другие слова, о которых мы говорили выше, называются эпонимами. Эпоним – это слово, от которого образованы имена нарицательные или другие имена собственные. В древности так называли божество, легендарного героя или реального человека, в честь которого назывались город или, например, река. Эпонимы XXI века, конечно, куда скромнее.

Изображение сгенерировано нейросетью lexica.art

Есть факт!

Интересную историю необычного словоупотребления рассказал в подкасте «Розенталь и Гильденстерн» главный редактор портала «Грамота.ру». По его словам, «хаккер» (именно с двумя -к) впервые встретился в отечественной прессе в 1987 году. В газете «Известия» новое слово заключили в кавычки, поясняя, что слово «хаккер» жаргонное: так в Германии называли игроков, которые часто нарушают правила.

Мы связались с рассказчиком и убедились, что история подлинная. Словарная статья о необычном «хаккере» представлена в книге «Новое в русской лексике. Словарные материалы 1987» (СПб., 1996).

Кликать на ссылку

Корпус русского языка – идеальный способ увидеть, как со временем меняется значение слов. Если слово «хакер» в русском языке раньше просто не существовало, то есть слова, которые мы уже привыкли воспринимать в «компьютерном» значении. Так, например, «кликать» (первоначально – «звать») превратилось в «щелчок мыши».

Динамика употребления слова «кликать» по годам

Первый пример словоупотребления в корпусе...

...и один из последних

А «ссылка» из формы наказания превратилась во «встроенный в текст адрес для перехода на другую страницу».

Впрочем, несмотря на эволюцию «ссылки», корпус предлагает «репрессивные» семантические ассоциации слова. На картинке – слова, которые чаще всего стоят в Национальном корпусе русского языка рядом с искомым

Вот ещё парочка говорящих примеров. Какое слово могло быть популярно и в 1700-х, и в 2000-х годах? «Портал». Из «архитектурного элемента» через века открылся портал на крупный сайт.

Открылся «портал» в нулевые

Вот два примера употребления одного и того же слова в Национальном корпусе русского языка. Почувствуйте разницу.

«Я не мог опомниться от удивления: наша Корроджио вся поместилась бы, казалось мне, в этот огромный дворец; широкие окна, наполненные зрительницами в богатейшем наряде, казались мне въездами в пространные улицы; глядя на портал дворца, я считал Храм Петра Римского сказкою или по крайней мере незначительно больше пармского дворца». Н. В. Кукольник «Антонио» (1840)

«Однако в Минцифры опровергли эту информацию – „учётные данные пользователей портала не были скомпрометированы, информация надёжно защищена“, отметили в ведомстве». Rozetked Discuss. Telegram Rozetked Discuss (2022)

На «боте» как на лодке ходят моряки. В «ботах» (то есть в ботинках) гуляют люди. А с развитием Интернета у нас появились новые боты – программы, имитирующие человека. В 2022 году почти половину всего трафика в Интернете генерировали не живые люди, а боты (их цифровые имитации).

Распределение слова «бот» по годам. Второе рождение слово получило в 2015 году


Языком нейросетей

Нейросетевой бум сделал популярным слово «промт» (от англ. prompt – подсказка). Промт – это команда для нейросети, состоящая из чётко сформулированной задачи, которую она должна выполнить. Само слово известно примерно с 1990-х, правда, в ином значении: PROMT (от PROject of Machine Translation проект машинного перевода) – российская компания, которая разработала программу для перевода текстов. Учитывая, что едва ли не все переводчики от «Гугла» до «Яндекса» работают на нейронных сетях, можно сказать, что история нейминга закольцевалась.

Результат генерации нейросети lexica.art по запросу «нейросеть»

Интересный факт: благодаря нейросетям свои машины-переводчики могут сделать все, у кого есть хотя бы начальный опыт в программировании. Например, прямо сейчас разработчик Давид Дале работает над первым нейросетевым переводчиком с эрзянского языка на русский. Кто знает, может скоро появится и программа для перевода с «айтишного» на русский.

А вот так фразу из начала нашего первого текста перевёл ChatGPT. Машина не поняла, что «тестовое» в этом контексте – задание, а не сервер. Митап же и вовсе остался без перевода.


Слово экспертам (и нейросети)

Ольга Паршина, заведующий кафедрой «Русский язык, литература и лингвокриминалистика» Тольяттинского государственного университета (ТГУ):

– Само по себе заимствованное слово всегда выполняет определённую функцию в языке. Варваризм – это заимствованное слово, которое имеет аналог в языке, например, жаргонные слова или молодёжный сленг. Но мы – носители языка – этот аналог не используем.

Однако если мы говорим именно о профессиональной сфере айти, то тут всё очень непросто. Речь идёт о профессиональном жаргоне. Это речевые особенности людей одного рода деятельности, которые постоянно друг с другом взаимодействуют. В отношении именно профессионального жаргона айти-специалистов мы о варваризации говорить не можем. То, что происходит с заимствованиями в этой сфере, видимо, является естественным следствием необходимости интенсивной профессиональной коммуникации, когда нерелевантна национальная принадлежность.

Тут важно понимать, что хотя в основном айтишники употребляют английские термины, русский язык всё равно будет стараться эти слова освоить, используя фонетическое обыгрывание. Это нормальный процесс, так происходит в любом языке. Но, например, у китайского сложнее структура, сложнее происходит адаптация, а все индоевропейские языки с очень хорошим «пищеварением».

Все программисты, тестировщики, программные разработчики и все остальные не привязаны к рабочему месту. Это цифровые кочевники, для них релевантны только собственные профессиональные качества, навыки, умения. Поэтому в рамках профессионального жаргона употребление этих слов нормально: людям комфортно, у них нет языкового барьера, все друг друга понимают.

Я не думаю, что этот жаргон «расползается» за пределы узкопрофессиональной сферы. Язык не терпит избыточности, это саморегулирующаяся система, поэтому даже если что-то «вылезло», как дань языковой моде, оно довольно быстро отпадает.

Артём Полтавцев, продакт-менеджер «Хабра», выпускник ТГУ:

– Думаю, что люди вне айтишной тусовки преувеличивают: особых слов в айти-сфере не больше, чем в любой другой профессии. Новые слова не появляются на пустом месте: за каждым из них стоит технология, фреймворк, особенности интерфейса какого-нибудь сервиса или чья-то удачная шутка. Поэтому значение по-настоящему новых слов непостоянно от команды к команде, у всех свой набор инструментов, внутренние мемы различаются. Когда значение закрепилось, новым слово уже не назвать, иначе окажешься в позиции бабушки, которая в 2023 году объясняет подружкам, что такое поп-ит.

Если вернуться на несколько лет в прошлое, могу выделить слово «вайтишник». Это такой неумелый разработчик, только что выпустившийся после курсов и ранее работавший в другой сфере. На фоне бума онлайн-школ рынок наводнили специалисты, которые отличались низкими навыками и высокими зарплатными ожиданиями. «Вайтишник» к ним прицепилось из-за слоганов курсов, предлагающих войти в айти.

Лично для меня раздражающих слов в IT нет, наоборот, есть любимые. Смешит, когда встречу называют «митинг» (от англ. meeting). При случае шучу, что ходить на ежедневные митинги – долг каждого уважающего себя разработчика.

Не думаю, что нашей повседневной речи что-то угрожает. Язык – это инструмент познания окружающего мира. Если для удобного описания этого самого мира не хватает слов, значит, инструмент затупился и ему необходим ремонт, поэтому не стоит бояться новых слов и слов-заимствований.

Анна Малявина, лингвист, преподаватель:

– На первом занятии по информационным технологиям в лингвистике мне приходится разрушать представление будущих переводчиков о том, что, связав жизнь с языками, они забудут о математике и пальцем не прикоснутся к программированию.

Язык – это система, которая «выкристаллизовалась» на протяжении веков из хаоса звуков, диалектов и неструктурированных явлений грамматики. Изучение речи строго алгоритмизировано, понимание синтаксиса – это процедура уяснения логики. Получается, что человек, овладевающий языками в профессиональных целях, становится чуть-чуть программистом.

Для удобства и лучшего запоминания почти все языки программирования создаются с использованием элементов естественных языков (от лексических единиц до синтаксиса). Большая часть языков программирования основана на английском языке, но есть и настоящие патриоты, например, в российской компании 1С коды пишут по-русски.

Будущие программисты изучают Java, PHP, Shell и Python точно так же, как лингвисты хинди, урду, пенджаби и телугу. Поэтому логично, что программисты в какой-то степени являются лингвистами. Хотя скорее они переводят язык пользователя на язык используемой технологии, чтобы она вернулась пользователю в виде, например, элемента интерфейса.

Чтобы соответствовать духу времени, мы взяли в соавторы этого текста нейросеть. ChatGPT прочёл весь наш текст и дописал последний абзац. Вот что получилось (орфография и пунктуация сохранены):

– Согласно исследованиям, влияние английского языка на русский в области информационных технологий неоспоримо. Варваризмы, айти-словечки и заимствования становятся неотъемлемой частью нашего языка, насыщая его новыми терминами и выражениями. Это свидетельствует о тесной связи русского языка с мировым информационным пространством и проникновении технического прогресса в нашу жизнь. Однако важно помнить, что развитие языка – это динамический процесс, который отражает изменения в обществе и технологиях. Хотя английские заимствования могут вызывать некоторую тревогу у филологов и языковедов, они также обогащают наш язык, придавая ему новые оттенки и возможности для выражения. Таким образом, можно сказать, что англо-русская лексика, насыщенная айти-терминами, является неизбежным результатом глобального технологического развития. Важно сохранять баланс между использованием заимствований и охраной русского языка, его уникальности и культурного наследия. Это позволит нам успешно справляться с вызовами информационной эпохи и развивать язык, чтобы он отражал современный мир и потребности его говорящих.

Для чистоты эксперимента мы дали слово новой нейросети YaGPT от «Яндекса». Получилось как получилось, зато радостно, что мы – журналисты – без работы точно не останемся:

– В наше время технологии и языки развиваются очень быстро, появляются новые слова и выражения, которые мы используем в повседневной жизни. Однако, некоторые исследователи считают, что проникновение заимствованных слов в русский язык может привести к его варваризации.

 

Ждём офер, заапрувим и начнём пилить контент с помощью интерфейса

Есть люди, которые считают, что все иностранные слова можно заменить русскоязычными аналогами. Давайте проведём эксперимент. Засекаем время. А теперь задание – с ходу подберите русский синоним слову «интерфейс». Справились? Предположу, что получилось нечто вроде «система, которая помогает взаимодействовать двум системам между собой». Сложновато для одного-то слова. Видимо, незаменимые слова всё-таки есть...

Желающие подучить матчасть курите мануал (перевод: вот наш традиционный «безошибочный» список)


Просмотров: 1227
Читайте также:
Поделиться с друзьями
Назад к списку статей