Российский государственный педагогический университет им. А. И. Герцена |
Кафедра прикладной лингвистики |
главная |
преподаватели |
бакалавриат |
магистратура |
публикации |
конференции |
фото |
25 - 26 марта 2010 г.
состоится
|
Тезисы |
Корпусная лингвистика
Богатырев М.Ю.
(Тула, ГОУ ВПО "Тульский государственный университет")
«Особенности построения концептуальных графов для проблемно-ориентированных систем извлечения знаний».
В работе рассматриваются возможности применения концептуальных графов как элементов семантической разметки текстов в проблемно-ориентированных системах извлечения знаний. Предлагается алгоритм построения концептуальных графов для русскоязычных текстов. Обсуждаются проблемы применения корпусов текстов в проблемно-ориентированных системах извлечения знаний.
Богданова С.В.
(Иркутск, Иркутский государственный лингвистический университет)
«Курс лекций «Корпусная лингвистика»: проблемы и пути решения»
Дисциплина «Корпусная лингвистика» относится к циклу Дисциплин специализации и преподается студентам филологических факультетов и лингвистических университетов для ряда направлений профессиональной подготовки, а на факультетах магистерской подготовки. В России существует ряд публикаций, специально созданных для преподавания данной дисциплины: например, учебно-методическое пособие В.П. Захарова «Корпусная лингвистика», ряд электронных курсов лекций (в частности, В.В. Рыкова) и др. Тем не менее, представленного в них материала недостаточно для полномасштабного курса лекций объемом 20-30 часов аудиторного времени. Учебные пособия, используемые за рубежом, не переведены на русский язык и не могут быть использованы в качестве базовых в учебном процессе. Таким образом, назрела необходимость в создании учебника «Корпусная лингвистика», рекомендованного компетентными органами для преподавания в российских вузах.
Дао Тху
(Вьетнам)
«Изучение корпусной лингвистики во Вьетнаме».
В настоящее время утверждается, что корпусная лингвистика в ее теоретическом аспекте начала иметь свое место во вьетнамской лингвистике. Это объясняется тем, что в практическом плане столкновение с огромным количеством информации во всех сферах общественной деятельности и распространение компьютерных технологий в последние годы приводят, в первую очередь, к подготовке различных видов электронных словарей и переводчиков, от чего требуется изучение новой отрасли науки, которая связала бы языковые и компьютерные знания,. Такая ситуация свидетельствует о необходимости исследования корпусной лингвистики во Вьетнаме.
Джепа Т.Л.
(СПб., РГПУ им. А.И. Герцена)
«Лингвистический инструментарий построения лексикографической базы данных на основе анализа предметно-ориентированного корпуса текстов».
Доклад посвящен сопоставлению методов работы с текстовыми данными, применяемых в корпусной лингвистике при построении конкордансов и последующем семантическом анализе выявляемых терминологических единиц, и методов автоматического выделения терминов в специальных текстах. Целью подобного сопоставления является выяснение потенциала указанных методов для составления лексикографической базы данных конкретной предметной области и её составной части – англо-русского электронного словаря. В качестве предметной области исследования выбрано авиационное двигателестроение.
Зубов А.В.
(Минск, Минский государственный лингвистический университет)
«Белорусско-иноязычные параллельные корпусы текстов и их использование в научных и учебных целях».
В докладе рассматриваются 3 белорусско-иноязычных параллельных тегированных подкорпуса текстов: белорусско-русский, белорусско-немецкий и белорусско-английский. Особое внимание уделено первому из этих подкорпусов. В нем выделяются две части: белорусско-русский подкорпус художественных, публицистических текстов и текстов деловой прозы и белорусско-русский подкорпус учебных текстов. Анализируются возможности использования их в научных и учебных целях. Затрагивается проблема «выравнивания» параллельных текстов на уровне абзацев и предложений.
Камшилова О.Н.
(СПб., РГПУ им. А.И. Герцена)
««Корпус английских текстов петербургских школьников»: промежуточные итоги».
«Корпус английских текстов петербургских школьников» – попытка создать электронную оперируемую текстовую базу данных для решения лингвистических и дидактических задач. «Корпус» представляет собой открытый проект, текстовая база которого может пополняться. Несомненным преимуществом корпусного метода, кроме аутентичного эмпирического материала, собранного в соответствии с исследовательскими задачами, представляется возможность многоаспектного подхода к анализу языкового объекта. Одна из лингвистических задач, которая решается на основе корпуса - анализ интерязыка. Перспективными представляются исследования словаря корпуса, специфики текстовых категорий. Очевиден также и методический потенциал размеченного подкорпуса ошибок. В настоящее время идет работа по созданию сопоставительного подкорпуса текстов учащихся (родные языки – китайский, корейский, испанский).
Каневский Е.А., Боярский К.К.
(СПб ГУИТМО)
«Морфолого-лексический анализатор и классификация текста».
Классификация текста является одним из важнейших способов его изучения. В докладе проблема классификации текста рассматривается в аспекте сопоставления фрагментов текста друг с другом с помощью контент-аналитического сравнения. В качестве примера рассматривается система ВЕГА, предназначенная для классификации и обработки социологической, и в первую очередь текстовой, информации. Встроенный в систему морфолого-лексический анализатор позволяет определять основную форму слова (лемму) и его принадлежность к тому или иному классу используемого классификатора. Это позволяет определять совпадение фраз не только по совпадению заданного количества лемм, но и по совпадению классов. Для снятия неоднозначности при определении леммы используются известная методика согласования слов по роду, числу и падежу, а также дополнительная семантическая информация из словаря В.А. Тузова. Применение созданного авторами набора правил анализа текста позволяет снизить уровень неоднозначности в несколько раз.
Кацнельсон И.А.
(Минск, Минский государственный лингвистический университет)
«Сравнительный анализ логико-семантического содержания англоязычных учебных и научных экономических текстов (на материале текстов подтемы кредитно-денежная политика)»
Рассматриваются вопросы логико-семантической организации текста. В качестве основной структурно-смысловой единицы текста выделяется абзац. Конкретизируются основные понятия логико-семантического анализа текста: предметно-логическое содержание абзаца, логико-семантическое содержание текста, логико-семантическая формула текста. Рассматривается методика построения логико-семантических формул текста. Приводятся наиболее употребительные логико-семантические формулы учебных и научных англоязычных экономических текстов, производится их сравнительный анализ.
Митрофанова О.А., Грачкова М.А., Шиморина А.С.
(СПб., СПБГУ)
«Опыт автоматической классификации лексики в текстах русско-словацкого параллельного корпуса».
В докладе обсуждаются результаты экспериментов по автоматической классификации лексики в русскоязычных оригиналах и в текстах их переводов на словацкий язык. Рассматриваются источники, предтавляющие художественный и научно-популярный стиль: романы А.С.Грина «Джесси и Моргиана», «Блистающий мир», а также книга Б.Сергеева «Живые локаторы океана». В ходе исследования проведен сравнительный анализ лексического состава и семантической структуры классов условной эквивалентности, сформированных для ключевых слов в текстах оригиналов и переводов.
Снитко А.Г.
(Гродно, Гродненский государственный университет имени Я.Купалы)
«Лингвокультурологическое моделирование с использованием лингвистических корпусов письменных и устных текстов».
Лингвокультурологическое исследование соответствует общей тенденции современной лингвистики, ориентированной на триединство «человек – язык – культура». Лингвокультурологический анализ ориентирован на изучение взаимосвязи и взаимодействия культуры и языка в его функционировании. Моделирование на основе полевой методики - наиболее удачный прием при проведении лингвокультурологического анализа культурно – маркированных единиц. Подобное структурирование материала помогает выявить не только семантические составляющие полисемантем и частотность их употребления, но и культурно-маркированную информацию, которую несет полисемантема, а также внутри- и межъязыковые различия. Лингвистические корпусы письменных и устных текстов все чаще рассматриваются как основной ресурс для проведения такого рода исследований. Корпус - источник специфической, национально-маркированной информации. Наибольшего эффекта можно достичь, работая с корпусами двух и более языков параллельно.
Шереметьева C.O., Дюмин Н.Ю., Мыларщикова Т.Ю.
(Челябинск, Южно-уральский Государственный Университет)
«О возможности межязыкового переноса систем автоматической обработки текста».
В докладе рассматриваются проблемы оперативного построения многоязычных систем автоматической обработки текста (АОТ) и снижения трудоемкости их создания. Подчеркивается необходимость разработки методик, лингвистических моделей и программного обеспечения, допускающих повторное использование в различных языках. Выдвинутые положения иллюстрируются на примере гибридной модели автоматического извлечения именных фраз из текста на английском языке, на основе которой создан программный продукт - инструмент АОТ многоцелевого назначения, отличающийся быстродействием и высоким качеством результатов. Описываются эксперименты по переносу модели на испанский и русский языки. Полученные результаты свидетельствуют о достаточной степени межязыковой универсальности подхода, который может быть широко использован как разработчиками других систем АОТ, так и в обучении иностранному языку.