• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Как нас правят гаджеты

Могут ли девайсы и глобальная сеть заменить справочник по грамматике

Для человека, который хочет изучать язык и его устройство, в сети доступно невероятное количество данных: самые разные тексты на всех возможных языках. Сейчас, например, мы можем не просто посмотреть, как люди употребляют новое слово, но и проследить, когда оно появилось в языке и как со временем меняется его значение. О том, как интернет изменил лингвистику, — в авторской колонке размышляет доцент Школы лингвистики НИУ ВШЭ, преподаватель Школы анализа данных «Яндекса», заведующий сектором теоретической семантики и ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН Борис Иомдин.


Борис Иомдин,
доцент Школы лингвистики НИУ ВШЭ,
преподаватель Школы анализа данных «Яндекса»,
заведующий сектором теоретической семантики,
ведущий научный сотрудник
Института русского языка им. В. В. Виноградова РАН

Вспомним, как было раньше? Выходили, допустим, словари новых слов. Откуда их авторы черпали информацию? В основном из собственных наблюдений: лингвист встречал где-то неизвестное слово, записывал его и постепенно накапливал материал. Но проверить — насколько это слово распространено — было очень трудно. Если сейчас вы заглянете в словарь актуальной лексики начала XXI века, вышедший в 2006 году, то обнаружите там, к примеру, слово «веб-таксофон». Но сейчас этого слова в языке нет. Да и тогда, скорее всего, по сути дела не было — поисковые системы почти не находят примеров. Мелькнуло и исчезло. «Спам» и «снек» остались, а «веб-таксофон» нет.

Зачастую, пока словарь готовят к изданию, редактируют — пока вся эта работа идет, слово успевает выйти из активного употребления или изменить значение.

Теперь даже для самых новых слов можно быстро получить статистику употребления — в интернете. Есть и методы автоматического выявления новых слов — скажем, в Твиттере. Но пока далеко не все можно решить без человека.

Писали мы как-то статью о сокращенных названиях бытовых предметов. Например, «велосипед» сейчас сокращают не только до знакомого многим «велик», но и до «вел». А если мы начнем изучать это слово в интернете, то столкнемся с проблемой, а именно с глаголом «вел» — только без точек. По контексту различить можно, но для этого нужно сесть и разбираться.

Говоря о языке и информационных технологиях, сложно уклониться от вопроса, ухудшает ли интернет грамотность. Однозначного ответа нет. С одной стороны, большинству пользователей интернет заменил орфографический словарь, а это не всегда надежно. Мой любимый пример — слово «борсетка». Да, именно так, через «о», это слово написано в орфографическом словаре, но написаний через «а» в интернете на порядок больше. Лингвист может обнаружить этот факт и сделать выводы, почему так получилось, чем оправдано одно и другое написание. А неспециалист просто использует вариант, который предлагают поисковые системы, не задумываясь — и тем самым нарушит норму. Для лексикографа интернет как огромное хранилище самых разных текстов — это замечательно, но для нелингвистов интернет как источник сведений об утвержденной норме — скорее плохо.

А хорошо ли, что компьютер и телефон исправляют за нас ошибки? Практика интернет-письма отличается от бумажной. Что написано пером, не вырубишь топором, а в Сети написанное обычно можно исправить. Это приводит к тому, что люди меньше следят за грамотностью: скорость важнее. Да и зачем напрягаться? Гаджеты нас поправят. 

Когда школьники, да и взрослые, переписываются, а смартфон исправляет их ошибки, это, в принципе, неплохо — лучше, чем создавать неграмотные тексты, которых в интернете и так хватает. Но телефон может сделать такую замену, что потом краснеть придется: неудачным автоисправлениям посвящены целые разделы юмористических сайтов.

Впрочем, курьезами дело не исчерпывается. Ошибки в таких текстах все равно есть, просто они другие — их сложно исправить автоматически. Например, если я напишу «какова черта» вместо «какого чёрта», машина не исправит написанное, потому что оба этих слова существуют, а определить смысл высказывания гораздо сложнее, чем проверить его написание. Системы проверки орфографии постоянно совершенствуются, но главный принцип сохраняется: необычные написания исправляются на более частотные. А это не всегда уместно.

Например, я часто использую в переписке аббревиатуру ЗК — задачная комиссия олимпиады по лингвистике. А программа Punto постоянно переключает раскладку и исправляет ЗК на PR. Понятно, что для большинства людей PR важнее, чем ЗК (кстати, и аббревиатура-то эта, ЗК, обычно означает вовсе не задачную комиссию). Но лично я про PR вообще не пишу, а про ЗК — часто. Это то, что в компьютерной лингвистике называется «длинный хвост».

Статистика может много чего решить, может быть, 90% задач, но дальше остается длинный хвост из огромного количества очень редких случаев. У кого-то ЗК, у кого-то домашнее имя, кто-то из принципа в шутку всегда пишет не АнЕчка, а АнИчка. Это как если бы мы писали в школе записки одноклассникам, а кто-то сидел рядом и исправлял: думаю, нам бы показалось это неуместным.

Лингвисты сейчас активно изучают интернет в том числе и как среду коммуникации. Люди здесь правда пишут не так, как в других местах. Этой теме посвящен ряд исследований. Иногда интернет-пользователи даже провоцируют появление новых  норм! Например, в школе нас учат ставить точку после предложения; в интернете после реплик в диалоге точки можно увидеть все реже. А если они вдруг появляются, это может восприниматься как проявление агрессии.

Аналогично и с большими буквами — мы гораздо реже используем их в Сети (или в сети?). Некоторые люди и вовсе пишут только с маленькой, даже имена и в начале предложения — не потому, что они безграмотные, а вполне осознанно: «Хочу и пишу все маленькими буквами, это создает одно впечатление, хочу — все большими, совсем другое».

С кавычками история тоже меняется. Например, вот мы играем в «Шляпу» или в шляпу? Вроде бы это название игры и кавычки нужны. Но вот футбол — тоже игра, название которой, как и в «Шляпе», происходит от предмета, который для этой игры нужен: football, футбольный мяч. Футбол всегда пишут с маленькой буквы, а игру в шляпу — не всегда, но в интернете чаще. Играть в «Дочки-матери» или в дочки-матери? В «Магазин» или в магазин? На интернет-форумах кавычек и больших букв не будет, а в бумажных журналах редакторы могут и поставить. Даже дети, которые ведут активную онлайн-переписку, ощущают, что в глобальной сети другие правила. Они могут специально писать «харашо» вместо «хорошо» — не потому, что не знают, как правильно, и не потому, что так быстрее. Просто тут так можно — это чат, а не контрольная.

Кто-то может сказать в итоге, что интернет — рай для лингвиста, но ад для учителя. На самом деле все несколько сложнее. Интернет — это разнообразие и огромные возможности для самовыражения, что, конечно, здорово. Но многие, прежде всего, дети — те, кто еще не усвоил нормы, — склонны воспринимать вариации как эталон. Раньше считалось, что человек, который много читает, имеет все шансы быть грамотным. Теперь же дети читают далеко не только учебники и хорошо отредактированные книги, и обилие неграмотных текстов действительно может плохо сказаться на умении писать без орфографических ошибок. Но, с другой стороны, школьное сочинение с ошибками прочтет только учитель, а пост в интернете увидят и, возможно, прокомментируют — укажут на ошибки — разные люди, так что появляется новый стимул писать грамотно. Что окажется важнее, еще предстоит выяснить, и это очень интересно!
IQ


Текст впервые опубликован на сайте наших партнеров — медиа о науке и жизни oLogy

Автор текста: Иомдин Борис Леонидович, 18 сентября