Дипломные работы бесплатно
курсовые, дипломы, контрольные, рефераты
Заказать
   » Главная  » Информационные технологии  » Разработка моделей и алгоритмов построения дерева синтаксических отношений русского языка

 


Введение

Глава 1. Изучение вопросов машинного перевода

1.1. Возможности современных систем машинного перевода

1.2. Анализ текстов на естественном языке

Выводы

Глава 2. Изучение вопросов, связанных с синтаксическими отношениями русского языка

2.1. Структура данных для синтаксического анализатора

2.2. Синтаксические отношения

Выводы

Глава 3. Проектирование программного обеспечения

3.1. Определение функций программного обеспечения

3.2. Разработка моделей и алгоритмов

3.3. Разработка базы данных

3.4. Руководство программиста

3.5. Руководство пользователя

3.6. Экспериментальная часть

Выводы

4. Организационно-экономическая часть

Выводы

5. Вопросы безопасности и экологичности

5.1. Информационная безопасность системы

5.2 Профиль защиты

5.3 Документация для администратора

5.4. Расчеты по охране труда для рабочего места оператора ПЭВМ

Выводы

Заключение

Список использованной литературы

Приложение 1. Текст вспомогательной программы.

Приложение 2. Текст основной программы

Приложение 3. Копии демонстрационных пакетов (на СD-ROM)

В век информационных технологий электронный перевод с одного языка на другой в последнее время приобрел большое значение. Существует много различных программ для машинного перевода. Есть потребность в разработке и русско-чувашского переводчика.

В дипломном проекте разрабатывается программа, которая позволяет строить дерево синтаксических отношений русского языка. Это нужно для того, чтобы пользователь мог увидеть на экране своего дисплея синтаксические отношения, существующие в каком-либо предложении текста. Это может быть использовано для синтаксического анализа предложения. В свою очередь, синтаксический анализ предложения необходим для полноценного русско-чувашского перевода. Это один из этапов, а другие этапы - это морфологический анализ, морфологический синтез и т.п.

В последнее время начали активно использоваться различного рода интеллектуальные информационные системы, в том числе и выполняющие обработку текстов на естественном языке. Один из классов таких систем образуют информационно-поисковые системы (ИПС), ориентированные на естественно-языковое общение с пользователем. Другой - системы машинного перевода (СМП).

Одним из ключевых элементов такой СМП является лингвистический процессор (ЛП). Задача ЛП - преобразование естественно-языкового предложения (или даже целого текста) в некоторый набор семантических структур, являющихся формальным представлением "смысла" исходного предложения или текста. Иногда ЛП решает также и обратную задачу - синтез текста (перевод) на основе этих семантических структур.

Классическая структура лингвистического процессора содержит три последовательных блока - для морфологического, синтаксического и семантического анализа текста. Кроме того, при подготовке исходных данных для работы ЛП может использоваться блок лексического анализа, осуществляющий фрагментацию исходного текста на предложения, а затем на слова, числа и знаки пунктуации. Будет ли этот блок непосредственно входить в состав ЛП, или станет частью его программной оболочки - зависит от конкретной задачи.

Лексический и морфологический анализ текста на ЕЯ не представляют серьезных трудностей для программной реализации. Первый сводится к стандартному лексическому анализу, применяемому для формальных языков (например, с помощью таблицы переходов), а второй - к поиску словоформы в базе данных (морфологическом словаре). Наибольшую трудность для разработки представляют механизмы синтаксического и семантического анализа. В некоторых ЛП эти функции реализованы совмещенными - в них выполняется очень глубокий синтаксический анализ с одновременным преобразованием распознаваемых синтаксических отношений в семантические.

1. Ю.М. Смирнов, А.М. Андреев, Д.В. Березкин, А.В. Брик. Об одном способе построения синтаксического анализатора текстов на естественном языке // Изв. вузов. Приборостроение, 2007. Т. 40, № 5 - стр. 34-42.

2. А.М. Андреев, Д.В. Березкин, А.В. Брик. Лингвистический процессор для информационно-поисковой системы // Компьютерная хроника , 1998. № 11 стр. 79-100.

3. C.D. Manning, R.Carpenter. Probabilistic Parsing Using Left Corner Language Models. 1997. // Опубликовано на сервере www.xxx.lang.gov/cmp-lg.

4. А.Ахо, Дж.Ульман. Теория синтаксического анализа, перевода и компиляции. Т.1. Синтаксический анализ. М.: Мир, 1978. - 612 с.

5. R.M. Losee. Learning Syntactic Rules and Tags with Genetic Algorithms for Information Retrieval and Filtering: An Empirical Basis for Grammatical Rules. // Information Processing & Management, 1995. // Опубликовано на сервере www.xxx.lang.gov/cmp.lg.

6. D.M. Magerman. Natural Language Parsing as Statistical Pattern Recognition. // A dissertation submitted to the department of computer science at the committee on graduate studies of Stanford University, 1994. // Опубликовано на сервере www.xxx.lang.gov/cmp.lg.

7. В.П. Желтов, А.Л. Михайлов, Е.Ф. Стаценко Автоматизированные системы обработки информации и управления: Метод. указания по оформлению студенческих работ. Чебоксары, Чуваш. ун-т, 2005. 60 с.

8. Желтов П.В. Лингвистические процессоры в системах искусственного интеллекта: Консп. лекций. Чебоксары: Изд-во Чуваш. ун-та, 2004. - 80 с.

9. Фаронов В.В. Система программирования Delphi. - СПб.: БХВ-Петербург, 2003. - 912 с.

10. Искусственный интеллект. - В 3-х кн. Кн.2. Модели и методы: Справочник. / Под ред. Д.А. Поспелова. - М.: Наука, 1999.

11. Э.В.Попов. Общение с ЭВМ на естественном языке. - М.: Наука, 2002.

12. А.М. Андреев, Д.В. Березкин, А.В. Брик, Ю.А. Кантонистов. Вероятностный синтаксический анализатор для информационно-поисковой системы /. http://www.inteltec.ru/publish/themes/textan.shtml.

13. Макконнелл Совершенный код. Практическое руководство по разработке программного обеспечения. - изд.: Питер, 2002. - 722 c., ISBN 5-469-00822-3.

14. Гутманс, Баккен, Ретанс PHP 5. Профессиональное программирование. - изд.: Символ-Плюс, 2005-524 c., ISBN 5-93286-083-9.

15. Фергюсон, Шнайер Практическая криптография. - изд.: Питер, 2006. - 384 c., ISBN 5-8459-0733-0.

16. Домарев Безопасность информационных технологий. Системный подход. - изд.: ДиаСофт, 2004. - 306 c., ISBN 966-7992-36-5.

17. Тактика защиты и нападения на web-приложения. - изд.: BHV-СПб, 2005. - 384 c., ISBN 5-94157-599-8.

18. Перфилова Е.Ф. Методические указания к выполнению организационно-экономической части дипломных проектов по созданию программной продукции. - Чебоксары: Изд-во Чувашского Госуниверситета, 2000. - 42 с.

19. Сибаров Ю.Г. Охрана труда в вычислительных центрах. - Учеб. пособие-М.: Машиностроение, 1988., 2000. - 64 с.

20. СниП №11-33-75. "Отопление, вентиляция и кондиционирование воздуха"

21. ГОСТ 28806-90. "Качество программных средств".

22. ГОСТ 28195-89. "Оценка качества программных средств"

23. СНиП 2.09.04-87. "Санитарно-гигиенические и эргономические требования".

24. СНиП П-12-77. "Защита от шума. Нормы и требования".

25. ГОСТ Р ИСО/МЭК 15408-2002. "Информационная технология. Методы обеспечения безопасности. Критерии оценки безопасности информационных технологий".

Примечаний нет.

 

Дисциплина: Информационные технологии