УДК 681.3: 581.51 К 15-летию киевской лаборатории искусственного интеллекта
Казаков А.И., Обухов Л.И., Ткаченко Н.А., Хоружий В.П., Хоружая И.А. 2014.
Киевская лаборатория искусственного интеллекта, г. Киев,
kazakov.alex@gmail.com
Аннотация
В данной статье кратко представлены некоторые из этапных разработок и проектов осуществленных в киевской лаборатории искусственного интеллекта (КЛИИ) за эти 15 лет. Идеологически, КЛИИ можно считать наследницей и продолжателем разработок в области биомедкибернетики и искусственного интеллекта созданных в школе академика Н.М. Амосова и д.т.н. Э.М.Куссуля.
Введение
В 2014 году киевская лаборатория искусственного интеллекта будет отмечать свое 15-летие. Целью создания нашей лаборатории было проведение исследований и разработок в интересных и стратегически ключевых, по нашему мнению, направлениях развития в таких областях знания как искусственный интеллект (ИИ) и медицинская кибернетика. Проведение исследований и разработок в этих областях знания является достаточно трудоемким делом, но оно опиралось на наш опыт и разработки, сделанные в предшествующее 10-летие в рамках проекта «Нейротехника». В 2000 г. в сборнике ИОИ-2000 вышли наши программные тезисы «На пути к машине общения» о планах работ КЛИИ на ближайшие годы [1].
В данной статье мы кратко представим некоторые из наших этапных разработок и проектов осуществленных за эти 15 лет. Наша лаборатория была основана в 1999 году. С 2000 г. мы приступили к выполнению проекта по созданию ядра системы ИИ в сильной форме. Основными этапами в этом проекте были следующие 4 этапа: 1. Создание базовой среды программирования. 2. Создание «Машины общения». 3. Создание «Машины понимания». 4. Создание «Машины познавания».
Описание этапов работ по проекту:
– Создание базовой системы языков программирования и общей для них программной среды на основе собственных вариантов языков программирования с необходимыми на наш взгляд свойствами. Были разработаны языки МикроЛисп-13 и Пролог-ХХI (LastProlog), в которых были доработаны их логические структуры. Подробнее можно ознакомиться на нашем сайте «NeuroTechnica.info» . В качестве общей среды была создана система «Вавилон», в которой средообразующими языками были выбраны языки Перл и Си. Эти работы, в основном, мы завершили в 2002 г.
– На втором этапе работ было создано лингвистическое обеспечение для «Машины общения». К 2003 году были созданы такие системы как «Конкорданс текстов на русском языке», система грамматических анализаторов русского языка и другие инструментальные и словарные системы, которые обеспечивали возможность работы с предложениями на русском языке из открытого множества текстов.
– На третьем этапе главной целью было создание «Машины понимания» текстов на русском языке. Было осознано, как необходимое условие, что для этого требуется создание самой среды программирования на русском языке и обеспечение ее совместимости с англоязычной средой программирования. Эти задачи были решены на основе разработанной нами программной среды «Велиар». Основным свойством этой среды была способность к буквальному пониманию выражений на естественном языке. Такой уровень понимания был создан на основе сильной формы ИИ, а не слабой, в которой только имитируется способность к пониманию. Этот этап работ был в основном завершен к 2005 году и описан в статье [2].
– Четвертым этапом проекта было создание «Машины познавания» (синонимом здесь является понятие «самообучающаяся система»). Была разработана математическая Теория Когнитронов, как система механизмов способных познавать новую информацию, поступающую из программной среды и символизировать ее, а также, была создана конструктивная реализация таких механизмов к 2008 году и описана в статье [3].
Перспективные разработки
Последующие исследования результатов данных разработок привели к пониманию, что на их основе открывается возможность осуществить работы по следующим новым проектам:
– Создание нового языка и системы программирования, еще более приближенных, по своим свойствам к естественным языкам и понятийной системе человека.
– Создание системы знания в форме «Древа Знания». Такая система будет способна взаимодействовать с человеком посредством общения и инструментально поддерживать стремления данного человека к овладению знаниями и умениями на разных этапах его обучения и практики, а также обеспечивать непрерывность его самообразования в течении всей его жизни. Система типа «Древа Знания» может стать носителем и гарантом нового типа авторского права, которое не будет служить тормозом для инноваций в области информатики.
– Создание системы формирования информационной копии человека и обеспечения его виртуального присутствия в социальных системах в форме системы типа «Аватарум». Создание технологий, которые будут способны интеллектуально помогать человеку и даже замещать его, когда это нужно данному человеку в его деятельности, как в виртуальности, так и в расширенной реальности данного социума (проект «Аватарум»).
О проекте «Эмбрио»
Одним из наиболее важных направлений разработок является создание нового языка программирования, который был бы базисно адекватен представляемой модели реальности в программных системах. Новый язык должен быть, по нашему мнению, таким, чтобы он мог единообразно представлять структуры и программ, и данных, и самих программных процессов. Такую единообразность можно обеспечить посредством древообразной структуры и поэтому, язык ЛИСП является естественным прототипом данного языка. В качестве рабочего названия языка мы пока приняли имя «Эмбрио». Разработка ведется на основе минимальной версии языка ЛИСП, содержащей всего 12 внутренних операторов и 1 внешний оператор – выдачи на печать. Такой минимальный ЛИСП мы называем МикроЛисп-13 или Лисп-13.
Язык Эмбрио позволит адекватно представлять все четыре базовых аспекта пространства – времени, а именно: для времени – это его событийность и течение, а для пространства – это место и протяженность. Для человека пространственно-временные соотношения даются ему через чувства и ощущения. Чувства формируются как сплетение аспектов течения во времени и протяженности в пространстве, а ощущения формируются как сплетение аспектов событийности во времени и места в пространстве.
Чувства и ощущения представляются в сознании человека посредством значений и образов. Человек получает в опыте жизни контекстно зависимую систему знаний в форме, как многообразия данного значения, так и многозначия данного образа.
Для фиксации таких форм знания и конструктивной работы с ними необходимы языки программирования со свойствами, подобными свойствам понятийной системы человека и, соответственно, реализуемой посредством естественных языков. В настоящее время таких языков программирования пока нет. Мы надеемся, что нам удастся полнее воплотить эти свойства в языке типа Эмбрио.
О проекте «Велиар»
Одной из наших попыток создать подобную систему программирования, демонстрирующую свойства естественного языка, была разработанная нами к 2005 году система «Велиар», благодаря которой нам удалось создать систему понимания текстов на естественном языке (русском). Тогда удалось достигнуть первых двух уровней понимания, а именно, буквального и идиоматического уровней понимания [2]. Всего же, по нашей классификации, мы выделяем 6 уровней понимания и нужно, в особых случаях, достигать по-очереди все 6 уровней, требуемых для полного понимания данного текста, т.е. от буквального и идиоматического уровней понимания и далее ассоциативно-переносного и т.д., вплоть до герменевтического уровня, – где сообщение зашифровано в тексте посредством иносказания.
Система понимания «Велиар» была способна отвечать на любые обстоятельственные вопросы по данному тексту, а именно: Что происходило? Кто это делал? Когда это происходило? В каком количестве это произошло? С какой целью это произошло? Почему это произошло? Каким образом это происходило? и другие варианты основных декларативных форм вопросов. Систему понимания определим как способность получать совокупность ответов на данный набор возможных вопросов по данному тексту, а мера полноты совокупности ответов определяло меру формального понимания системой данного текста. Система «Велиар» продемонстрировала очень высокую степень формального понимания для буквального и идиоматического уровней понимания.
В качестве дополнения к данной системе в рамках проекта создания «Машины общения» были разработаны еще две системы, которые обеспечивали речевой уровень общения с ней: система распознавания слитной речи на основе НММ-технологии и система синтеза речи на основе трифонных моделей фонем. При вопросо-ответном характере общении с системой по теме данного текста достигался вполне приемлемый для лабораторной практики уровень распознавания речи, уровень понимания вопроса и уровень разборчивости речи, синтезированной по текстовому ответу системы «Велиар», с возможностью учета интонационного и эмоционального содержания сообщения.
Для продвижения к следующим уровням понимания текстов стали видны следующие две ключевые проблемы:
- Необходимость в способности системы распознавать самоподобные структуры в собственных для системы программах, данных и процессах;
- Необходимость в собственной познавательной способности у системы понимания. Решение 1-й проблемы будет обеспечиваться новым языком программирования типа «Эмбрио». Для решения 2-й проблемы нами в 2007 году были начаты работы по созданию ядра системы познавания. В результате была создана первая версия системы познавания, которую мы назвали «Когнитрон» (см. статью [3]). Работы в этих направлениях продолжаются.
О проекте «КАНТ»
Другим важным направлением работ было создание экспертной системы диагностики состояния человеческого организма «КАНТ» и развития ее до системы автоматической диагностики и последующей ее стыковки с системой понимания «Велиар». Ниже дается краткое описание системы «КАНТ», разработка которой началась в 1994 году, а развитие продолжается и поныне.
В основе экспертной системы «КАНТ» лежат следующие составляющие:
- система диагностики состояния организма человека, базирующаяся на методе Накатани, современной нозологической системе классификации болезней (МК-10) и на собственных разработках исследовательской группы: Казаков А.И., Ткаченко Н.А.
- система измерений электрической активности в биологически активных точках организма (БАТ),
- технология измерения токов в БАТ посредством деполяризующихся электродов, эта технология была разработана ранее в объединениии ФИЗЛИ Инт.
- методика для проведения лечебных процедур посредством биофореза лекарственных веществ за счет собственных управляющих токов организма человека созданная на основе разработок ФИЗЛИ Инт. и собственного опыта применения биофореза. Практика работы по диагностике и лечению заболеваний (преимущественно желудочно-кишечного тракта) на протяжении многих лет (более 18 лет), показала высокую точность диагностики КАНТ и эффективность лечения на ее основе. Диагностика и лечение производились в лаборатории диагностики и лечения, созданной на базе лечебно-профилактического санатория «Феофания» НАН Украины.
Адекватность и точность работы экспертной системы диагностики «КАНТ» обеспечивается:
– высокой чувствительностью метода измерений на основе деполяризующихся электродов,
– разработанной авторами системы классификации состояний органов и систем организма по соотношениям значений величин токов, генерируемых в организме человека его симпатической и парасимпатической системами, которые управляют состояниями организма человека,
– учетом в системе более 800 нозологических форм заболеваний в соответствии с МК-10, распознаваемых посредством решения соответствующих систем уравнений,
– большим практическим опытом врача-диагноста, участвующего в развитии системы КАНТ,
– постоянным развитием метода на основе сопоставления результатов авторской системы диагностики и диагностики проводимой на основе других методов исследования состояний организма (УЗИ, ЭКГ, анализы и др.).
Обладание этими составляющими позволило в 2008 г. на основе системы КАНТ создать экспертную систему автоматической диагностики состояний органов и систем организма (CАД КАНТ). Данная экспертная система «КАНТ» может лечь в основу и будущего интернет-сервиса по удаленной и автоматической предварительной диагностике, необходимой в системах телемедицины. Основанием для этого являются ряд информационных технологий разработанные в киевской лаборатории искусственного интеллекта, а именно:
– система защиты личной и медицинской информации с управляемым доступом к данным,
– система аутентификации личности человека по физической и цифровой подписям,
– система понимание текстов на естественном языке.
Эти системы позволят обеспечить организацию более эффективного, защищенного и качественного взаимодействия экспертной системы типа CАД КАНТ с врачом-куратором и его пациентом для составления анамнеза заболевания путем направленного опроса пациента самой системой, проведение консультационных и профилактических бесед самой системой в соответствии с запросом пациента и/или рекомендациями врача-куратора.
Все перечисленное выше составляет необходимую основу также и для создания лечебно-диагностического, профилактического и информационного центра нового типа.
Заключение
Коллектив КЛИИ за эти годы создал и много других разработок и программных продуктов. Среди них можно отметить такие:
– ряд систем обучения украинскому языку для англоговорящих людей,
– спеллчеккер для азербайджанского языка, встроенный во все продукты Microsoft Office,
– технологии, обеспечивающие распознавание слитного рукописного текста в момент его написания и ряд других разработок, с некоторыми из них можно ознакомиться на нашем сайте www.neurotechnica.info
Литература
- Казаков А.И., Хоружий В.П., Обухов Л.И., На пути к машине общения. // Тезисы докладов Международной научной конференции «Интеллектуализация обработки информации» / Симферополь: Крымский научный центр НАН Украины, Таврический национальный университет, 2000. – с. 34-35.
- Казаков А.И., Обухов Л.И., Система понимания естественного языка. // Материалы конференции «Интеллектуальный анализ информации», / Сб. трудов. – Изд. «Просвита», г. Киев. – 2005.- с. 157-166.
- Казаков А.И., Обухов Л.И., Проект теории когнитронов. // Материалы конференции «Интеллектуальный анализ информации», / Сб. трудов. – Изд. «Просвита», г. Киев. – 2008.-с. 228-237.