Автоматический графематический анализ
выделение в тексте слов, чисел, нахождение границ устойчивых сочетаний и предложений; выделяемые текстовые единицы называются токенами.
корпус текстов, содержащий тексты на языке-источнике и множество текстов — переводов на др. язык (языки).
русского языка (далее – НКРЯ), представленного большим электронным корпусом текстов; ядром русскоязычных...
Также в НКРЯ входит параллельный корпус, состоящий из многоязычной части....
Подразделениями НКРЯ являются:
основной корпус;
синтаксический корпус;
газетный;
параллельный (официально...
правовые блоки);
учебный;
диалектный;
поэтический;
устный;
акцентологический;
мультимедийный;
исторический корпус...
Более сложный и специализированный лексико-грамматический поиск в корпусе осуществляется по грамматическим
В данной статье мы попытаемся рассмотреть уже существующие параллельные корпуса русских и китайских текстов, чтобы не только познакомить с ними читателя, но и извлечь опыт из их разработки и показать перспективу и направление дальнейшей работы. Рассматриваются следующие корпуса: параллельный корпус переводов «Слова о полку Игореве», который содержит переводы данного памятника на разные языки, в том числе на китайский; параллельный русско-китайский корпус в составе Национального корпуса русского языка; полистилевой русско-китайский и китайско-русский параллельный корпус, создаваемый под руководством Цуй Вэя; русско-китайский параллельный корпус научных текстов гуманитарной области, создателем которого является китайский ученый Тао Юань; русско-китайский переводческий корпус, разработанный китайским ученым Лю Мяо и разделенный на три блока: подкорпус рассказов Чехова, китайско-русский подкорпус художественной литературы, подкорпус обучения русскому языку как иностранному; китайско-рус...
Корпусная лингвистика: понятие, виды корпусов
Определение 1
Корпусная лингвистика иногда рассматривается...
В практике изучения иностранных языков используются так называемые параллельные корпусы текстов, которые...
Другим видов корпусов является так называемые дискурсивные корпусы, которые представляют собой выборки...
Это могут быть совокупности публицистических или художественных текстов, корпусы разговорной речи, корпусы...
Наличие автоматической поддержки обработки и поиска для работы с корпусом.
Представлено описание разработки параллельного таджикско-русского корпуса. Рассматривается общий механизм корпуса, структура базы данных текстов, алгоритмы обработки текста, а также автоматическое управление корпуса с использованием авторской программы Taj-Rus-Corp. Разработка параллельного корпуса будет способствовать организации машинного перевода текстов с таджикского языка на русский.
выделение в тексте слов, чисел, нахождение границ устойчивых сочетаний и предложений; выделяемые текстовые единицы называются токенами.
член пары или ряда взаимно обусловленных, соотносительных языковых единиц.
слова, словоформы и словосочетания, присущие просторечию, т.е. обиходно-бытовой речи разных социальных слоев, стоящей за пределами литературного языка или на его периферии.
Возможность создать свои термины в разработке
Еще чуть-чуть и ты сможешь писать определения на платформе Автор24. Укажи почту и мы пришлем уведомление с обновлением ☺️
Включи камеру на своем телефоне и наведи на Qr-код.
Кампус Хаб бот откроется на устройстве