Posts Tagged ‘NLP’
Новый взгляд на книгу «Логический способ обучения. Альтернативное образование», напечатанную в 1990 году.
ПРЕДИСЛОВИЕ ОТ АВТОРА Фатма ханум Бунятова
Предприниматель и известный российский ученый-философ Аркадий Аркадьевич Захаров, ознакомившись еще в 90 годах с содержанием моего учебного пособия «Логический способ обучения», приобретенного в Душанбе, в благодарственном письме, обращенном в мой адрес писал: «Подобный подход я применял при создании разных пособий, в том числе при написании учебного издания «Двадцать шесть времен за двадцать шесть минут» для изучения временных конструкций английского глагола. Недавно нами разработан электронный тренажер, который позволяет применять некоторые из описанных подходов в обучении с использованием компьютера. Намереваемся разработать несколько различных тренажеров, используя схемы и подходы к обучению, представленные в Вашем пособии. Предлагаем вам принять участие в создании электронных тренажеров и внести предложения о возможностях совместить Ваши и наши технологии обучения». Профессор посоветовал повторно опубликовать учебное пособие.
Но, к тому времени, поскольку я не останавливалась на уже достигнутых результатах, разработка авторского инновационного подхода обучения детей ушла далеко вперед, внедряясь в другие дисциплины и их тематику.
Приглашение команды team Academi.edu принять участие в обсуждении статьи Mohamed Taybe Elhadi и Ramadan Sayad Alfared из Zawia Universit «A Grammatically and Structurally Based Part of Speech Tagger for Arabic LanguageFull» (https:airccse.org/journal/ijnlc/vol11.html) сподвигло взглянуть на предлагаемый инновационный подход к обучению с другой позиции, а именно, с позиции Natural Language Computing (далее NLP). Ознакомившись с содержанием статьи и с библиографическими ссылками в ней мне стало ясно, что авторский подход, представленный в первом издании данного учебного пособия (стр. 60-70) является не чем иным, как структурная обработка естественного русского языка и его тегирования с позиции понимания NLP. В частности, рассматривая слова с позиции Stanford Tagger /1/, где Теггер части речи (POS-тегер) – это часть программного обеспечения[1], которая считывает текст на каком-либо языке и присваивает части речи каждому слову (и другому токену), например существительному, глаголу, прилагательному и т. д. Замечу, что упрощенная форма этого тегирования обычно преподается ученикам в школе в виде идентификации слов как существительных, глаголов, ,прилагательных наречий и т. д.
Несомненно, что кроме Stanford Tagger существуют и другие подходы к обработке языка. Алгоритмы POS-тегов делятся на две отличительные группы: основанные на правилах и случайные. POS-теги Брилла tagger Э. Брилла, –это индуктивный метод тегирования части речи. Он был изобретен Эриком Бриллом и описан в докторской диссертации (1993г.) Его можно кратко охарактеризовать как «средство тегирования, основанное на преобразовании, управляемом ошибками», то есть:
- форма контролируемого обучения, направленная на минимизацию ошибок;
- процесс, основанный на преобразовании, в том смысле, что тег назначается каждому слову и изменяется с использованием набора предопределенных правил.
В книге «Логический способ обучения. Альтернативное образование» (с. 68-74) я кодировала с морфологической позиции 6 основных частей речи, вместе с их кореллянтами, представляя этим конечную формулировку частей речи. Таким способом было создано более 60 графических тегов русского языка.
Эти теги () были созданы на основании программы русского языка для национальной школы и применялись для создания целостного видения языковых знаний в морфологи и синтаксисе. Причем подход был не индуктивный, как (теги Брауна), а дедуктивный. Набор слов подвергался операции классификации, и каждому слову присваивался тег в виде основной части речи. Следующей операцией, операцией замещения, словесные теги замещались последовательными цифрами и приобретали вид 1-сущ.; 2-прилаг. и т.д. Этими шестью тегами были обозначены инвариантные знания в схеме шесть основных частей речи. Каждой части речи присваивались соответствующие им корелянтные – переменные правила в виде подтегов. Они тоже замещались цифрами, и, в итоге, приобретали вид, который содержал в себе морфологические знания о рассматриваемой части речи.
Например, схема: https://www.researchgate.net/publication/367220495_F_D_Bunatova_Logiceskij_sposob_obucenia_Alternativnoe_obrazovanie/stats стр. 6-7
требует придумать: одушевленное существительное в «Муж. Роде, Един. Числе, в творительном падеже», на пример: братом; отцом, другом и т. д.
В итоге описанный здесь подход отличается от существующих подходов тем, что слова могут обозначаться тегами, на пример: кодируйте слово «книге»
«книге – сущ., неодуш., Ед. ч., Ж. р., Дат. падеж, схема:
Или же наоборот, к тегам подбираются соответствующие слова, то есть проводятся обратные действия или логическая операция обратимости.
Отметим, что в логическом подходе тегирования можно составлять композицию, провести логические операции замещения, мультипликативные операции, а это позволяет операционально обработать текст.
Развивая эту мысль на протяжении 30 лет в виде целостной и нечеткой модели естественного и искусственного языка, (на примере русского языка) инвариантные знания языка (части речи) были выражены через: х1-х10, переменные (категориальные правила языка) через: у1-у8. Таким образом, формула в течении 30 лет преобразовываясь приобрела вид:
+ х1, у1у2, у35
где:
+х1 – тег одуш. сущ.
у1 – тег Единст. Числа;
у2 – тег М.р.
у35 – тег Творительного падежа
Создавая компьютерную программу на основании представленных выше теговых моделей, слова, находя свои теговые ячейки и проходя через них, будут сами глубоко обрабатываться учащимися. В последствие, логические теги нами были применены:
- в моделировании естественного и искусственного азербайджанского и русского языков;
- в моделировании целостных и нечетких учебных программ азербайджанского и русского языков для начальной школы;
- в нечетком моделировании биологических знаний логических структур знаний;
- моделировании структур содержания машинного обучения;
- структур знаний э-учебника в 3Д;
- в SMART программе русского и азербайджанского языов и т.д. (http://www.idrak-m.com/?p=5608).
Так как логические теги созданы как инструменты целостной и нечеткой логики, то их можно считать универсальными и применимыми не только к обработке текстов, но и ко всему тому, что подлежит счислению, то есть ко всем обучаемым дисциплинам.
Закончить предисловие
хочется цитатой Анри Пуанкаре: «То, что подвергается счету – это наука».
[1] Kristina Toutanova and Christopher D. Manning. 2000. Enriching the Knowledge Sources Used in a Maximum Entropy Part-of-Speech Tagger. In Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora (EMNLP/VLC-2000), pp. 63-70.
Кристина Тутанова и Кристофер Д. Мэннинг. 2000. Обогащение источников знаний, используемых в тегере частей речи с максимальной энтропией. В материалах совместной конференции SIGDAT по эмпирическим методам обработки естественного языка и очень больших корпусов (EMNLP/VLC-2000. с. 63-70.
Baxış: 151