УДК 681.3: 581.51
К 15-летию киевской лаборатории искусственного интеллекта
Казаков А.И., Обухов Л.И., Ткаченко Н.А., Хоружий В.П., Хоружая И.А. 2014.
Киевская лаборатория искусственного интеллекта, г. Киев,
kazakov.alex@gmail.com
Аннотация
В данной статье кратко представлены некоторые из этапных разработок и проектов осуществленных в киевской лаборатории искусственного интеллекта (КЛИИ) за эти 15 лет. Идеологически, КЛИИ можно считать наследницей и продолжателем разработок в области биомедкибернетики и искусственного интеллекта созданных в школе академика Н.М. Амосова и д.т.н. Э.М.Куссуля.
Введение

В 2014 году киевская лаборатория искусственного интеллекта будет отмечать свое 15-летие. Целью создания нашей лаборатории было проведение исследований и разработок в интересных и стратегически ключевых, по нашему мнению, направлениях развития в таких областях знания как искусственный интеллект и медицинская кибернетика. Проведение исследований и разработок в этих областях знания является достаточно трудоемким делом, но оно опиралось на наш опыт и разработки, сделанные в предшествующее 10-летие в рамках проекта «Нейротехника». В 2000 г. в сборнике ИОИ-2000 вышли наши программные тезисы «На пути к машине общения» о планах работ КЛИИ на ближайшие годы [1].
В данной статье мы кратко представим некоторые из наших этапных разработок и проектов осуществленных за эти 15 лет. Наша лаборатория была основана в 1999 году. С 2000 г. мы приступили к выполнению проекта по созданию ядра системы искусственного интеллекта (ИИ) в сильной форме. Основными этапами в этом проекте были следующие 4 этапа: 1. Создание базовой среды программирования. 2. Создание «Машины общения». 3. Создание «Машины понимания». 4. Создание «Машины познавания».
Описание этапов работ по проекту

1. Создание базовой системы языков программирования и общей для них программной среды на основе собственных вариантов языков программирования с необходимыми на наш взгляд свойствами. Были разработаны языки МикроЛисп-13 и Пролог-ХХI (LastProlog), в которых были доработаны их логические структуры. Подробнее можно ознакомиться на нашем сайте «NeuroTechnica.info» . В качестве общей среды была создана система «Вавилон», в которой средообразующими языками были выбраны языки Перл и Си. Эти работы в основном мы завершили в 2002 г.
2. На втором этапе работ было создано лингвистическое обеспечение для «Машины общения». К 2003 году были созданы такие системы как «Конкорданс текстов на русском языке», система грамматических анализаторов русского языка и другие инструментальные и словарные системы, которые обеспечивали возможность работы с предложениями на русском языке из открытого множества текстов.
3. На третьем этапе главной целью было создание «Машины понимания» текстов на русском языке. Было осознано как необходимое условие, что для этого требуется создание самой среды программирования на русском языке и обеспечением ее совместимости с англоязычной средой программирования. Эти задачи были решены на основе разработанной нами программной среды «Велиар». Основным свойством которой, была способность к буквальному пониманию выражений на естественном языке. Этот уровень понимания был создан на основе сильной формы ИИ, а не слабой, в которой только имитируется способность к пониманию. Этот этап работ был в основном завершен к 2005 году и описан в статье [2].
4. Последним этапом проекта было создание «Машины познавания» (синонимом здесь является понятие «самообучающаяся система»). Была разработана теория когнитронов, как механизмов способных познавать новую информацию, поступающую из программной среды и символизировать ее, а также была создана их конструктивная реализация к 2008 году и описана в статье [3].
Перспективные разработки

Последующие исследования результатов данных разработок привели к пониманию, что на их основе открывается возможность осуществить работы по следующим новым проектам:
1. Создание нового языка и системы программирования, еще более приближенных, по своим свойствам к естественным языкам и понятийной системе человека.
2. Создание системы знания в форме «Древа Знания». Такая система будет способна взаимодействовать с человеком посредством общения и инструментально поддерживать стремления данного человека к овладению знаниями и умениями на разных этапах его обучения и практики, а также обеспечивать непрерывность его самообразования в течении всей его жизни. Система типа «Древа Знания» может стать носителем и гарантом нового типа авторского права, которое не будет служить тормозом для инноваций в области информатики.
3. Создание системы формирования информационной копии человека и обеспечения его виртуального присутствия в социальных системах в форме системы типа «Аватарум». Создание технологий, которые будут способны интеллектуально помогать человеку и даже замещать его, когда это нужно данному человеку в его деятельности, как в виртуальности, так и в расширенной реальности данного социума (проект «Аватарум).
О проекте «Эмбрио»

Одним из наиболее важных направлений разработок является создание нового языка программирования, который был бы базисно адекватен представляемой модели реальности в программных системах. Новый язык должен быть, по нашему мнению, таким, чтобы он мог единообразно представлять структуры и программ, и данных, и самих программных процессов. Такую единообразность можно обеспечить посредством древообразной структуры и поэтому, язык ЛИСП является естественным прототипом данного языка. В качестве рабочего названия языка мы пока приняли имя «Эмбрио». Разработка ведется на основе минимальной версии языка ЛИСП, содержащей всего 12 внутренних операторов и 1 внешний оператор - выдачи на печать. Такой минимальный ЛИСП мы называем микролиспом или М-Лисп.
Язык Эмбрио позволит адекватно представлять все четыре базовых аспекта пространства -времени, а именно: для времени - это его событийность и течение, а для пространства – это место и протяженность. Для человека пространственно-временные соотношения даются ему через чувства и ощущения. Чувства формируются как сплетение аспектов течения во времени и протяженности в пространстве, а ощущения формируются как сплетение аспектов событийности во времени и места в пространстве. Чувства и ощущения представляются в сознании человека посредством значений и образов. Человек получает в опыте жизни контекстно зависимую систему знаний в форме, как многообразия данного значения, так и многозначия данного образа.
Для фиксации таких форм знания и конструктивной работы с ними необходимы языки программирования со свойствами, подобными свойствам понятийной системы человека и реализуемой посредством естественных языков. В настоящее время таких языков программирования пока нет. Мы надеемся, что нам удастся полнее воплотить эти свойства в языке типа Эмбрио.

О проекте «Велиар»

Одной из наших попыток создать подобную систему программирования, демонстрирующую свойства естественного языка, была разработанная нами к 2005 году система «Велиар», благодаря которой нам удалось создать систему понимания текстов на естественном языке (русском). Тогда удалось достигнуть первых двух уровней понимания, а именно, буквального и идиоматического уровней понимания [2]. Всего же, по нашей классификации, мы выделяем 6 уровней понимания и нужно, в особых случаях, достигать по-очереди все 6 уровней, требуемых для полного понимания данного текста, т.е. от буквального и идиоматического уровней понимания и далее ассоциативно переносного и т.д., вплоть до герменевтического уровня, - где сообщение зашифровано в тексте посредством иносказания.
Система понимания «Велиар» была способна отвечать на любые обстоятельственные вопросы по данному тексту, а именно: Что происходило? Кто это делал? Когда это происходило? В каком количестве? С какой целью? Почему это произошло? Каким образом это происходило? и другие варианты основных декларативных вопросов. Совокупность ответов на весь спектр возможных вопросов по данному тексту и определяло меру формального понимания системой данного текста. Система «Велиар» продемонстрировала очень высокую степень понимания для буквального и идиоматического уровней понимания.
В качестве дополнения к данной системе в рамках проекта создания «Машины общения» были разработаны еще две системы, которые обеспечивали речевой уровень общения с ней: система распознавания слитной речи на основе НММ-технологии и система синтеза речи на основе трифонных моделей фонем. При вопросо-ответном характере общении с системой по теме данного текста достигался вполне приемлемый для лабораторной практики уровень распознавания речи, уровень понимания вопроса и уровень разборчивости речи, синтезированной по текстовому ответу системы «Велиар», с возможностью учета интонационного и эмоционального содержания сообщения.
Для продвижения к следующим уровням понимания текстов стали видны следующие две ключевые проблемы:
1. Необходимость в способности системы распознавать самоподобные структуры в собственных для системы программах, данных и процессах;
2. Необходимость в собственной познавательной способности у системы понимания.
Решение первой проблемы будет обеспечиваться новым языком программирования типа «Эмбрио». Для решения 2-й проблемы нами в 2007 году были начаты работы по созданию ядра системы познавания. В результате была создана первая версия системы познавания, которую мы назвали «Когнитрон» (см. статью [3]). Работы в этих направлениях продолжаются.
О проекте «КАНТ»

Другим важным направлением работ было создание экспертной системы диагностики состояния человеческого организма «КАНТ» и развития ее до системы автоматической диагностики и последующей ее стыковки с системой понимания «Велиар». Ниже дается краткое описание системы «КАНТ», разработка которой началась в 1994 году, а развитие продолжается и поныне.
В основе экспертной системы «КАНТ» лежат следующие составляющие:
- система диагностики состояния организма человека, базирующаяся на методе Накатани, современной нозологической системе классификации болезней и на собственных разработках исследовательской группы: Казаков А.И., Ткаченко Н.А.
- система измерений электрической активности в биологически активных точках организма (БАТ),
- технология измерения токов в БАТ посредством деполяризующихся электродов, эта технология была разработана ранее в объединениии ФИЗЛИ Инт.
- методика для проведения лечебных процедур посредством биофореза лекарственных веществ за счет собственных управляющих токов организма человека созданная на основе разработок ФИЗЛИ Инт. и собственного опыта применения биофореза.
Практика работы по диагностике и лечению заболеваний (преимущественно желудочно-кишечного тракта) на протяжении многих лет (более 18 лет), показала высокую точность диагностики КАНТ и эффективность лечения на ее основе. Диагностика и лечение производились в лаборатории диагностики и лечения, созданной на базе лечебно-профилактического санатория «Феофания» НАН Украины.
Точность работы экспертной системы диагностики «КАНТ» обеспечивается:
- высокой чувствительностью метода измерений на основе деполяризующихся электродов,
- разработанной авторами системы классификации состояний органов и систем организма по соотношениям значений величин токов, генерируемых в организме человека его симпатической и парасимпатической системами, которые управляют состояниями организма человека,
- учетом в системе более 800 нозологических форм заболеваний, распознаваемых посредством соответствующих систем уравнений,
- большим практическим опытом врача-диагноста, участвующего в развитии системы КАНТ,
- постоянным развитием метода на основе сопоставления результатов авторской системы диагностики и диагностики проводимой на основе других методов исследования состояний организма (УЗИ, ЭКГ, анализы и др.).
Все это позволило создать в 2008 г. на основе системы КАНТ экспертную систему автоматической диагностики состояний органов и систем организма (CАД КАНТ). Данная экспертная система «КАНТ» может лечь в основу и будущего интернет-сервиса по удаленной и автоматической диагностике, необходимой в системах телемедицины. Основанием для этого являются технологии разработанные в киевской лаборатории искусственного интеллекта, а именно: система защиты личной и медицинской информации с управляемым доступом к данным, система аутентификации по физической и цифровой подписям, система понимание текстов на естественном языке для организации более эффективного и качественного взаимодействия экспертной системы с врачом-куратором и пациентом для составления анамнеза заболевания путем направленного опроса пациента, проведение консультационных и профилактических бесед в соответствии с запросом пациента и рекомендациями врача-куратора. Все перечисленное выше составляет необходимую основу также и для создания лечебно-диагностического, профилактического и информационного центра нового типа.
Заключение
Коллектив КЛИИ за эти годы создал и много других разработок и программных продуктов. Среди них можно отметить такие: ряд систем обучения украинскому языку для англоговорящих людей, спеллчеккер для азербайджанского языка, встроенный во все продукты Microsoft Office, технологии, обеспечивающие распознавание слитного рукописного текста и ряд других разработок, с некоторыми из них можно ознакомиться на нашем сайте www.neurotechnica.info.
Литература
1. Казаков А.И., Хоружий В.П., Обухов Л.И., На пути к машине общения. // Тезисы докладов Международной научной конференции «Интеллектуализация обработки информации» / Симферополь: Крымский научный центр НАН Украины, Таврический национальный университет, 2000. – с. 34-35. 2. Казаков А.И., Обухов Л.И., Система понимания естественного языка. // Материалы конференции «Интеллектуальный анализ информации», / Сб. трудов. – Изд. «Просвита», г. Киев. - 2005.- с. 157-166.
3. Казаков А.И., Обухов Л.И., Проект теории когнитронов. // Материалы конференции «Интеллектуальный анализ информации», / Сб. трудов. - Изд. «Просвита», г. Киев. - 2008.-с. 228-237.

Добавлена статья Проект теории когнитронов

Создание новой расширенной среды программирования “Велиар-3″. Новая среда позволяет интегрировать в единую исполняемую систему модули, отвечающие за способности к распознаванию слитной речи, ее пониманию, ответам на вопросы по буквальному содержанию текстов на русском языке и модуль синтеза слитной речи для озвучивания ответов системы.

Наша система анализирует текст со скоростью 100 000 предложений в секунду.

Первая демонстрация системы ИИ начального уровня, в которой была продемонстрирована способность системы к буквальному пониманию
предложений на русском языке.

Завершение работ по созданию среды программирования “Велиар”, предназначенной для разработки систем класса “Искусственный интеллект”.