Параллельные корпусы текстов на языке-источнике и третьем языке.

англ.

Кроме словарного перевода существительного math, «математика», другие толкования неизвестны. В таких случаях очень часто оказываются чрезвычайно полезными названные в подзаголовке ресурсы. Заходим в поисковик Google, выбираем французский язык, набираем английские слова, например, math is и вскоре находим подборку двуязычных параллельных текстов, где английскому предложению If my math is correct and if the math of all the other actuaries to whom I have spoken is correct,… соответствует французское Si j’ai bien fait mes calculs, et si tous les actuaires auxquels j’ai parlé en ont fait autant,… Перевод найден: речь идет о расчетах, вычислениях.

[битая ссылка] http://www.linguee.fr/anglais-francais/traduction/if+my+math+is+correct.html

франц.

Для глагола taper, встретившегося в тексте, посвященном компьютерной технике, в словаре имеется только перевод «печатать на пишущей машинке». Абстрагируемся сейчас от того, что любой, даже начинающий, переводчик догадается и сам, что речь идет о наборе на клавиатуре, – здесь речь идет просто о методе. Итак, набрав в «английском Гугле» французские слова taper sur le clavier, найдем параллельные тексты, где против французского предложения Tapez sur le clavier «giveusatank» de nombreuses fois приведено английское Type on the keyboard «giveusatank» many times. Перевод английского глагола нам известен, а значит, и французский глагол переводится как «наберите».

[битая ссылка] http://www.linguee.fr/francais-anglais/traduction/taper+sur+le+clavier.html

Одноязычные тексты на языке-источнике

(на самые разные темы)


Здесь-то и встречается множество «открытий», и именно на этих материалах я строю в значительной степени примеры, приводимые в Части второй настоящей работы. Как справедливо сказано в одном из исследований, «В связи с тем что изобилие текстов представлено в электронной форме и находится в свободном доступе в Интернете, самым большим корпусом можно считать сам Интернет (Web as Corpus), а средствами доступа к этому корпусу являются поисковые машины, например Google. Корпус – это информационно-справочная система, основанная на собрании текстов на некотором языке в электронной форме». [19] Далее в той же работе следует оговорка: «Но тексты в Интернете хаотичны, лингвистически интересный запрос часто сложно или невозможно сформулировать с помощью языка запросов поисковой машины, по результатам поиска нельзя оценить представительность выборки (какие тексты не были выложены в сеть или не были найдены данной поисковой системой) и т. д… По этой причине были созданы национальные лингвистические корпусы. Корпусная лингвистика использует моно- и многоязычные корпусы текстов, которые нередко аннотированы лингвистически значимой информацией, например о частях речи, леммах, морфологических признаках, синтаксической структуре. семантической интерпретации.» [id.] Учитывая, что здесь наши задачи лежат вне рамок теории корпусной лингвистики и сосредоточены на сугубо утилитарной цели, заключающейся в восполнении пробелов традиционных словарей – в данном конкретном случае посредством использования монолингвальных корпусов на иностранных языках, – оставим только что приведенную оговорку без внимания и прокомментируем только первую часть цитаты. Следуя этой логике, если корпусом можно считать весь Интернет, то тем более таковым можно считать каждый из его отдельных веб-сайтов, а двигаясь в направлении уменьшения объема массива текста, и просто достаточно протяженный фрагмент текста, начиная от какой-то главы документа, далее ряда связанных единой мыслью нескольких абзацев этой главы, одного-единственного абзаца, и так вплоть до отдельного предложения, если содержащейся в нем информации достаточно для однозначного понимания значения всех составляющих его слов.