АННОТАЦИЯ:
В статье на основе анализа механизмов работы памяти и принятия решений человеком рассматривается субъектно-ориентированная комплексная компьютерно-мозговая модель работы памяти, научения и процедуры выработки решений и целесообразность использования такой модели при создании сложных технических систем, в том числе, интеллектуальных систем анализа данных и систем с искусственным интеллектом, работающих в условиях неопределенности, и для которых важна оперативность и ситуативная достоверность в принятии решений.
КЛЮЧЕВЫЕ СЛОВА: Система апперцепции, матрица эмоций, кратковременная, временная, долговременная и квазипостоянная память.
SUMMARY:
In article, based on the analysis of the mechanisms of memory and making decision of man is considered a complex subject-oriented computer-brain model of memory, learning and decision-making procedure to them and the usefulness of such model for the creation of complex engineering systems, including data mining systems and systems with artificial intelligence, working in conditions of uncertainty, and for which is important operativeness and situational reliability decision-making.
KEY WORDS: Apperception system, matrix of emotions, short-term, temporary, long-term and quasi-persistent memory.
ВВЕДЕНИЕ
В сложных системах, работающих в условиях недостаточной определенности, для оптимальной обработки входной информации, стараются использовать интеллектуальный (Data Mining) анализ данных [1]. Не менее важно для таких систем принятие робастных и адекватных ситуации решений. Эти задачи во многом близки к проблемам постоянно решаемыми живыми организмами. Поэтому, учитывая относительную новизну рассматриваемых задач для сложных систем и отработанные эволюцией у живых организмов до совершенства механизмы памяти и выработки решений, проявляется повышенный интерес к анализу работы этих механизмов у живых организмов и их эмуляции для создания сложных технических систем.
В процедуре восприятия человеком поступающей информации, ее осознания и принятия
решений (ПР) его память играет определяющую роль и, следовательно, в его действиях и намерениях. Поэтому организацией памяти человека, помимо нейрофизиологов и психологов-бихевиористов, активно интересуются специалисты в области когнитивной психологии и теории принятия решений [2, 3], а также создатели искусственных нейронных сетей, нейрокомпьютеров и систем искусственного интеллекта (СИИ) [4, 5, 6].
Различают три основных этапа обработки информации в памяти человека: получение информации из внешней среды и ее кодирование, хранение информации в памяти и извлечение из памяти.
Выделяют, исходя из вариантов извлечения из памяти, имплицитную (неосознаваемую) и эксплицитную (осознаваемую) виды памяти [2]. Процесс обработки информационного сигнала происходит параллельно, как на бессознательном уровне, связанным с работой имплицитной памяти, так и на сознательном уровне, связанном с эксплицитной памятью, и отклик на сигнал поступает из областей головного мозга, связанных с этими уровнями, по двум нервным путям в миндалину лимбической системы, где формируется сигнал реагирования [7]. При этом обработка информации на бессознательном уровне происходит значительно быстрее и разница между имплицитной и эксплицитной реакциями может достигать 500 мс [8] и, если мозг не принимает решения, исходя из установленных им критериев, о приоритете эксплицитной реакции, то миндалина формирует сигнал управления на основе более быстрой имплицитной реакции. В опытах с конфликтными стимулами было зафиксировано использование испытуемыми имплицитного навыка в ситуации, когда конфликтных стимулов было до 25%, а при их количестве в 75%, испытуемые стали использовать только эксплицитные знания [9]. Большая часть времени поведения человека происходит на автоматическом бессознательном уровне.
По длительности хранения и объему запоминаемой информации выделяют два разных типа памяти: кратковременную память (КП) и долговременную память (ДП) [2]. Такое разделение было подкреплено рядом моделей памяти на основе компьютерной метафоры, с помощью которой проводят аналогию между преобразованием данных компьютером и познавательными процессами у человека. При этом, сама компьютерная метафора была выработана на основе когнитивной метафоры, используемой в когнитивной психологии, путем общения со специалистами в области вычислительной техники, нейронауки, информатики и искусственного интеллекта [10].
Достаточно популярной, до настоящего времени, является модель памяти Р. Аткинсона и Р. Шиффрина [11], по которой текущая входная информация из внешней среды поступает в сенсорные регистры, где сохраняется около 300 мс. Эта информация сканируется и по сигналу с системы управления (СУ) выбранные данные переносятся в КП, где производится их кодирование. Объем КП ограничен и каждый поступающий в КП новый образ (паттерн) приводит к обновлению состояния этой памяти и может вытеснить более ранний паттерн. Максимальное время хранения паттернов в КП до 30 с. С КП информация по сигналу с СУ поступает в ДП, где может хранится постоянно и в больших объемах. Между ДП и КП имеется обратная связь, которая позволяет по управляющему сигналу с СУ возобновлять ранее полученную информацию в КП.
Поступающая в сенсоры информация по данным, приведенным в [10], сохраняется в сенсорной памяти от 250 мс до 4 с, длительность хранения информации в КП, без ее возобновления, 12 с и время воспроизведения каждого паттерна 35 мс.
На основании исследований по определению возможностей хранения в КП различных данных, Дж. Миллером [12] был определен предел одномоментной информационной пропускной способности человека числом 7±2 чанков («магическое число 7 2»), где чанк (chunk) некий смысловой образ (паттерн), который может быть, например, как запоминаемой буквой, так и целой фразой. Позднее Г. Саймоном [13] объем КП был определен в диапазоне от пяти до семи чанков. Последующими когнитивными экспериментами предел пропускной способности КП был понижен до четырех чанков [14] и в работе [15] показан в диапазоне от трех до четырех чанков, если не учитывать
повторяющиеся составляющие.
Как показали эксперименты Р.Стернберга [10], при увеличении количества одновременно обрабатываемых паттернов возможно снижение скорости обработки информации и наоборот. Исследования по визуальному подсчету количества предметов в поле зрения показали, что такой подсчет происходит очень быстро и точно для числа предметов от одного до четырёх, но медленно и с ошибками для большего числа предметов [16]. Для быстрого процесса определения количества предметов в [17] было введено понятие «субитизация», а для диапазона быстро подсчитываемых предметов «диапазон субитизации». Для количества предметов, которое попадает в диапазон субитизации, время, затраченное на пересчёт предметов, находится в пределах 40–100 мс на предмет, а для числа предметов по количеству больше четырех — 250–350 мс.
Исследования, проведенные Брендой Милнер, показали, что при поражении гиппокампа у пациентов нормально работает КП, но не сохраняется новая информацию в ДП. Дальнейшее исследования Милнер показали, что повреждается только долговременная эксплицитная память и сохраняется долговременная имплицитная память, которая связана с научением перцептивных и моторных навыков [18]. Таким образом, была подтверждена необходимость разделения КП и ДП и выделение имплицитной и эксплицитной памятей.
В соответствии с представлениями большинства когнитивных психологов простой дихотомии памяти, представленной в модели [11], недостаточно и с КП связывают процессы ПР и работу эксплицитной памяти. Она осознанно контролируется человеком и участвует в кратковременном хранении и обработке вербальной и зрительной информации [19]. Учитывая активный характер такой временной памяти, связанный с обработкой поступающей в нее информацией совместно с ранее занесенной в ДП, такую память назвали рабочей (РП). Бэддли и Хитч разработали первую модель РП [20], состоящую из трех компонентов: фонологической петли (ФП), отвечающей за временное хранение вербальной информации, зрительно-пространственной матрицы (ЗПМ), отвечающей за повторение образов и их кратковременное хранение, и центрального администратора (ЦА), координирующего обработку поступающей информации, хранении и извлечение информации из ДП.
Позже Бэддли разработал новую модель РП [21], показанную на рис. 1, введя четвертый
Рис.1. Многокомпонентная модель РП Бэддли
компонент, эпизодический буфер (ЭБ), обеспечивающий временный интерфейс между ФП, ЗПМ и ДП. ЭБ способен хранить информацию в многомерном коде и управляется ЦА. В нижней части рис.1 показана процедура формирования когнитивной системы, которая способна накапливать долговременные знания через обмен данных между визуальной семантикой (ВС), эпизодической долговременной памятью (ЭДП) и вербальной информацией (ВИ).
Нейрофизиологами при анализе работы центральной нервной системы человека было обнаружено, что при формировании ДП происходит задержка во времени, и, условно, можно говорить о наличии между КП и ДП промежуточной вторичной памяти. Во вторичной памяти может накапливаться поступающая с КП информация от нескольких минут до нескольких лет, частично стираться и преобразовываться перед сохранением ее в ДП. Одной из особенностью вторичной памяти является то, что время обращения к ней значительно больше, чем при обращении к КП и ДП. В результате была разработана модель памяти на основе 3-х видов времени хранения информации [22]. Из сенсорной памяти информация поступает в первичную память и там может повторяться через обратную связь с выхода на вход первичной памяти, либо забываться или переносится во вторичную память. Во вторичную память также поступает с сенсорной памяти часть имплицитной информации. Со вторичной памяти информация поступает в третичную память, в которой сохраняется информация в течение всей жизни.
В живых системах эмоции нацелены на выживание индивидуума и его вида, и исследования функционирования головного мозга показали важную роль эмоций в выработке решений человеком [23]. Также было обнаружено, что при поражении миндалины лимбической системы, у пациентов происходило нарушение формирования мгновенной (первичной) эмоциональной реакции, а при повреждении вентромедиального сектора префронтальной коры нарушение формирования вторичной эмоциональной реакции, выработанной на основе накопленного предыдущего опыта [24, 25], что говорит о наличии эмоциональной памяти. Проведенные исследования показывают разнообразное влияние эмоций на работу когнитивной области памяти [26]. И в результате выявленной двунаправленной связи между лимбической системой, отвечающей за выработку эмоций, и кортикальными центрами, которые регулируют эмоции, когнитивные психологи переходят к более сложным моделям ПР [27].
Для построения всего многообразия эмоций используют некоторое количество базовых эмоций, которое у разных специалистов колеблется от 2 до 14 [28]. На основе данных об исследовании центров выработки эмоций у человека, проведенных А. Дамасио [29] и другими психологами, в [30] для СИИ в виде эмоциональных интеллектуальных агентов (ЭИА) предлагается в качестве базовых искусственных эмоций использовать шесть аналогов эмоций вида: страх, удовольствие, отвращение, страдание, восхищение, тревога.
Эмоции имеют важное значение при принятии быстрого, автоматического, на бессознательном уровне решения. И от адекватности эмоций ситуации и богатства их оттенков будет зависеть оптимальность реагирования. Каждая из эмоций играет свою особую роль. При этом страх и удовольствие можно отнести к динамически быстрым эмоциям по отношению к внешней среде. Формирование отвращения к чему-либо может быть задержано во времени и производится на основе извлечения информации из временной памяти. Страдание связано с оценкой внутреннего состояния, однако в социуме на ее основе может сформироваться внешняя эмоция в виде сострадания по отношению к кому-то. Восхищение является внешней эмоцией, стимулирующей подражание и являющейся важным фактором при научении. На ее основе может сформироваться эмоция доминантности. При нескольких повторениях отрицательных раздражителей формируется тревожное состояние. Эта эмоция переводит организм в состояние повышенной готовности и, в то же время, значительно ограничивает количество вариантов при ПР.
В [30] предполагается, что такая база эмоций позволит для ЭИА, исходя из набора его потенциальных возможностей, условий окружающей средой и целей, создавать индивидуальную матрицу эмоций для его успешного функционирования. Комбинация базовых эмоций поможет ЭИА избегать опасные ситуации, стимулировать к достижению целей и обеспечения необходимыми энергетическими ресурсами, контролировать техническое состояние отдельных частей и состояние программного обеспечения. Эмоция восхищения, стимулируя подражание, в комбинации с удовольствием будет обеспечивать быстрое усвоение новых навыков, а эмоция тревоги будет перестраивать систему принятия решений ЭИА на оперативное, более быстрое реагирование на внешние раздражители при некотором снижении оценочной достоверности ожидаемого результата.
В связи с наличием эмоциональной памяти, следует отметить, что, помимо связанных со входной информацией (ощущениями) сенсорных видов памяти, также имеется выходная по отношению к мозгу кратковременная память, внешне отражающая на лице эмоциональное состояние и через обратную связь поддерживающая это состояние, чем снижается нагрузка на работу когнитивной системы [7]. Такую память, связанную с мышцами лица, можно обозначить как мимическую. В [31] приведены данные об эксперименте психологов с двумя группами испытуемых. Одна группа смотрела комиксы с зажатым в зубах карандашом так, чтобы он не касался губ. Это имитировало улыбку. Другая группа смотрела комиксы с корандашом зажатым одними губами. Это делало выражение лица нахмуренным. Группа, имитировавшая улыбку с помощью карандаша, оценила комиксы более смешными, чем та группа, что «хмурилась». Этот пример может иллюстрировать действия обратной связи между мимической памятью и мозгом. Таким образом, «keep smiling» можно рассматривать как вспомогательное, но, конечно, не определяющее средство поддержания хорошего настроения.
ПОСТРОЕНИЕ И АНАЛИЗ РАБОТЫ КОМПЬЮТЕРНО-МОЗГОВОЙ МОДЕЛИ
Из рассмотренного выше видно, что представленные модели памяти не отражают многие аспекты, связанные с ее функционированием. Кроме того, компьютерные модели памяти, разработанные для анализа мозговой деятельности человека, мало дают информации для разработки сложных технических систем, включая СИИ. С другой стороны, полученная информация о деятельности мозга, в том числе и благодаря использованию компьютерных моделей, дает богатый материал специалистам в области искусственного интеллекта и настала пора использовать мозговую метафору для разработки СИИ. Исходя из этого, рассмотрим построение компьютерно-мозговой модели формирования памяти, научения и выработки решений, позволяющей с одной стороны более комплексно смоделировать процессы, происходящие в головном мозгу, а с другой стороны поможет при создании сложных технических систем.
При построении компьютерно-мозговой модели учитывается характерная для живых организмов особенность, связанная с тем, что они, как и предполагаемые СИИ, постоянно работают в условиях значительной неопределенности внешней среды.
На рис. 2 представлена субъектно-ориентированная комплексная компьютерно-мозговая модель памяти и принятия решений (КММППР). Эта модель является некоторым видоизменением ранее предложенной автором КММППР [32].
Рис.2. Компьютерно-мозговая модель памяти и принятия решений
Поступающая человеку внешняя информация и информация о его состоянии с учетом
эмоционального вектора проходит процедуру апперцепции и заносится в кратковременную (рабочую) память. При этом сенсоры сенсорной памяти адаптируются к текущим ощущениям под управлением системы апперцепции (СА). СА выполняет функцию анализа и обработки, как внешних данных, так и данных о состоянии субъекта. Отсортированная в СА информация через КП поступает во временную память (ВП). В КП из СА также заносятся необходимые для обработки ранее поступившие паттерны информации с ВП, с ДП и с квазипостоянной памяти (КПП).
КПП включает в себя генетическую [33] и эпигенетическую виды памяти [34] и определяет базовые эмоции (врожденные реакции на окружающую среду) типа «Неудовольствие – Удовольствие» и врожденные навыки и обеспечивает генетическую предрасположенность назначений отдельных участков мозга. Название этого вида памяти квазипостоянной, в первую очередь, определяется свойствами эпигенетической памяти.
Исполнительная моторная память (ИМП), включает моторную, мимическую и другие периферийные виды памяти. В условиях большой неопределенности внешней среды для сложных систем роль ИМП становится менее заметной и иногда может снижаться.
Диспетчеризация всеми процессами в системе и выработка решений производится системой принятия решений (СПР). Текущее состояние системы через СА поступает в СПР для корректировки выработки решения.
В СА производится практически одновременно распознавание поступившего паттерна, классификация и, с учетом имеющихся в ВП, ДП и КПП данных, быстрая процедура подбора субъектно-ориентированной аппроксимационной модели паттерна с необходимым восстановлением модели по частично заданным признакам паттерна. Модели паттерна (далее по тексту паттерн) Pi, исходя из ряда критериев, присваивается векторный маркер mi размерности j
mi = [mi1, mi2, … , mij], (1)
где величина j определяется количеством оценочных критериев для паттерна, j [1,k], k – максимально возможное число критериев.
При этом по одной из множества составляющих векторного маркера mi производится эмоциональная оценка паттерна, а по другой привязка ко времени, для которой, например, мозг человека использует биологические ритмы. Каждая из j составляющих маркера характеризуется двумя параметрами – видом и величиной. В дальнейшем векторный маркер mi может служить для определения адресов паттерна в кластерном пространстве памяти.
По составляющим векторного маркера производится отображение паттерна в пространстве памяти (картирование) и, таким образом, имеется возможность, исходя из множества критериев j, по которым оценивается паттерн, иметь множество соответствующих им отображений паттерна, что соответствует пространственной организации памяти живых организмов [7, 10]. Само отображение паттерна может быть также вектором меньшей размерности.
Работу СА, совместно с КП и ВП, по обработке входных данных можно, в некоторой степени, сравнить с работой временной иерархической памяти HTM (Hierarchical Temporal Memory) [35], представляющей из себя 6-ти уровневые иерархические слои с большим количеством обратных связей. HTM имитирует вертикальные гиперколонны неокортекса, осуществляющие обработку и накопление информации. Для этого варианта маркеры будут иметь иерархическую многовекторную структуру.
Время хранения текущей информации в КП несколько больше времени ее оценки в СА и, после обработки, сформированные отображения паттерна либо переносятся в ВП или паттерн, в силу ограниченности емкости хранилища КП, вытесняется новой информацией.
Поступающая в ВП имплицитная информация также маркируется в СА по своим
критериям. На основе этих данных в ВП с помощью СА, КП, ДП и КПП вырабатываются субъектные модели навыков (СМН) и затем они закрепляются в ДП.
СА осуществляет роль некоего привратника Фрейда. Фрейд условно поместил его в мозгу человека между прихожей, в которую поступает вся сенсорная информация, и вторым помещением, в котором содержится сознание, при этом привратник цензурирует эту информацию и пропускает выбранную осознанную часть, исходя из своих эмоциональных предпочтений [36]. Но если воспользоваться аналогией Фрейда, то для рассматриваемого СА, привратника надо повысить до должности секретаря-референта, раскладывающего по папкам (кластерам) поступающую текущую информацию, придавая ей определенную эмоциональную окраску. Он производит сортировку, селекцию и накопление данных в кластерах, производя, таким образом, интеллектуальную обработку данных, и, естественно, 2-х комнатную квартиру Фрейда надо расширить, добавив третье промежуточное помещение для канцелярии, роль которой для СА выполняют КП и ВП. При этом КММППР можно рассматривать как субъектно-ориентированную. В СИИ для реализации функции привратника по оценке данных могут быть использованы нейронные сети, построенные на основе теории адаптивного резонанса (модель ART) [37].
В [7] на ряде экспериментов, при формировании научения при сенсибилизации и классическом обусловливании, была показана важность повторения для закрепления в памяти информации с разбиением числа повторений на серии и разнесением их во времени. С другой стороны, при реакции привыкания было отмечено снижение отклика на не несущие важную информацию внешние сигналы и такая информация не будет долго сохраняться.
Поступающие в ВП отображения паттернов проверяются на их актуальность с помощью предварительной кратковременой частотно-временной фильтрации (ЧВФ), путем определения их важности, на основании величины эмоциональной оценки присвоенного маркера, частоты и времени поступления. Аналогом такой ЧВФ может служить рассмотренная в [38] фильтрация в промежуточной памяти СИИ за счет дискретной линейной свертки величин оценки маркера Qv(n) паттерна v с дискретно-временной весовой функцией W(n)
. (2)
Величина Qv(n), в зависимости от поступления на вход ЧВФ повторяющегося паттерна или его отсутствия, будет принимать дискретные значения Qv или 0.
В качестве дискретной весовой функции W(n) можно использовать применяемую в нейронных сетях сигмоидную функцию вида
, (3)
где k – коэффициент крутизны весовой функции; β – показатель степени ;|м;;; А – нормирующий множитель.
Показатель степени β определяет форму весовой функции W(n). Выбор β оказывает влияние на робастность оценки v.
Исходя из эмоциональной оценки и сопутствующих факторов, выходные данные ЧВФ по поступающим подобным паттернам рассматриваются как реакции привыкания, сенсибилизации или ассоциативного научения, при этом векторный маркер может быть откорректирован, как для выходных паттернов так и для поступающих в КП подобных
паттернов.
Для технических систем реакцию привыкания к входным паттернам можно рассматривать как антиспамовую фильтрацию в ВП несущественной или мешающей работе данной системы информации. А реакции сенсибилизации и ассоциативного научения, при присвоении СА входным паттернам определенной эмоциональной окраски, как признаки дальнейшего использования этих паттернов для научения. По некоторым эмоциональным оценкам паттернов, при превышении в ЧВФ порога возбуждения, производится формирование в CПР состояния повышенной готовности системы.
Прошедшие через ЧВФ статистическую обработку отображения паттернов, исходя из присвоенного СА классификационного маркера, поступают в соответствующие кластеры ВП. На базе всех поступающих новых информационных ресурсов в ВП, с использованием данных КП и ДП, производится усложнение и формирование новых кластеров и создание на этой основе пространства субъектных моделей знаний (СМЗ). В пространстве СМЗ производится развернутая во времени адаптивная итерационная процедура генерации аттракторных СМЗ за счет увеличения веса более субъектно-достоверных моделей знаний и подавление других, относящихся к этому классу СМЗ.
Учитывая процедуру формирования СМЗ ее также можно назвать субъектным аттрактором знаний.
Каждый раз при поступлении СМЗ в КП производится их новая эмоциональная оценка, осуществляя как бы новое их осознание, и СА через КП заносит СМЗ в соответствующий кластер ВП с новым векторным маркером. В процессе генерации все более сложных СМЗ происходит увеличение веса более достоверных для субъекта моделей знаний и подавление других СМЗ. Таким образом, по мере поступления новых паттернов образуются более сконцентрированные (высокодобротные) аттракторы СМЗ и, таким образом, повышается их достоверность. Это характерно для экспертов, которые накапливают данные в течение многих лет [13].
Через цепи обратной связи с ВП и ДП в регистры КП поступают паттерны СМЗ. Это ограничивает емкость КП для входных данных и может мешать оперативному реагированию на изменения в окружающей среде. Этот фактор следует учитывать при анализе работы целостной системы, осуществляющей процедуры распознавания входных данных, накопления знаний, прогнозирования и выработки решений.
С другой стороны процедура формирования сложных СМЗ затруднена при активном реагировании человека на внешние сигналы в состоянии бодрствования из-за ограниченной пропускной способности КП. Однако природа нашла превосходное решение по повышению эффективности интеллектуального аппарата. Во время сна или в период отдыха мозг переходит в дефолтное состояние. При этом автогенерация сложных СМЗ будет происходить по внутреннему контуру в мозге через цепи обратных связей, идущих от разных участков памяти на КП, а не на основе поступающей внешней информации. Субъектно-ориентированная система выработки и принятия решений в результате последовательных действий обратных связей дефолтной нервной системы резонансно настраивается по отношению к раздражителю, И входная информация о раздражителе будет составлять лишь малую долю всей обрабатываемой информации для формирования сложной СМЗ. Для консолидации СМЗ необходимо наличие эмоциональной оценки события, дефолтного состояния мозга и времени на формирование СМЗ в этом состоянии. Этим можно объяснить результаты исследований эмоционально шокирующего воздействия на человека [39], показавшие селективное и ретроактивное усиление воспоминания, после 6 часов и более, о произошедшем в паре с шоком событии.
Формирование СМЗ в ВП производится по аналогии с адаптивной подстройкой синапсических связей соседних нейронов в мозгу, приводящая к усилению одного или группы нейронов и подавления работы окружающих [4]. В системах, на основе искусственных нейронных сетей, такое научение возможно на основе модели ART и
подобных ей разработок [4, 37].
Появление высокодобротного главного аттрактора СМЗ стимулирует генерацию, на базе имеющихся информативных ресурсов, новых локальных аттракторных СМЗ, которые могут составить конкуренцию главной СМЗ и одна из локальных СМЗ может сменить главную.
Использование термина аттракторных СМЗ, вместо применяемых терминов следы памяти или энграммы, отражает активный динамический и несколько стохастический характер формирования СМЗ.
Представленная КММППР раскрывает соотношение случайного и детерминированного в формировании наших знаний и навыков и, в частности, объясняет эффект называемый судьбой. Мы случайно чем-то заинтересовались, сгенерировали начальную СМЗ и дальнейшее ее пополнение, включая и автогенерацию по внутреннему контуру в мозгу, приводит к увлечению на всю жизнь.
Длительность формирования СМЗ в ВП может быть достаточно большой, у человека она достигает нескольких лет, и после достижения определенного порогового уровня, она закрепляется в ДП.
Привязка поступающих сигналов к векторному маркеру, создаваемому по ряду критериев, одним из которых является эмоциональная оценка, дает элемент осознания информации, а выработка субъектом адаптированного к нему маркера, исходя из его индивидуальных эмоциональных навыков, определяемых его физическими возможностями, опытом, социальной и природной средой, обеспечивает ему элементы индивидуального самосознания. Подобное возможно для СИИ при ее взаимодействии с окружающей средой и ей подобной системой, но отличной от нее (модифицированной) по каким-либо параметрам.
Промаркировав входящую информацию субъект, например, уже может ответить на философский вопрос ребенка у поэта Маяковского «Что такое хорошо и что такое плохо?». И это будет сугубо индивидуальный ответ, поскольку он будет связан с его индивидуальной реакцией. Более того, исходя из обстоятельств, внешней среды, внутреннего состояния, более глубокого (ассоциативного) осмысления, эмоциональная оценка может измениться и ответ будет другой и иногда даже противоположный предыдущему. Яркий этому пример поведения, описанного как «стокгольмский синдром».
Формирование СМЗ с маркерной привязкой позволяет ее целенаправленно комбинировать с другими СМЗ, обрабатывать их и, в том числе, производить с ними логические операции, что можно рассматривать, как осмысленные действия.
В СИИ обработку входных данных, которые можно представлять в виде нечетких множеств с присвоением им маркеров, возможно производить на основе КММППР с применением нейро-нечетких сетей [4] и HTM [35].
В ряде работ [2, 26] показано, что информация в ассоциации с чем либо легче запоминается, например, известный метод размещения Цицерона, связывающий нужное для запоминания с последовательностью известных объектов, и такая ассоциация дает значительно большую вероятность извлечения нужной информации. В [2] также приводятся данные о том, что положительные эмоции дают большую вероятность восстановления положительной информации и наоборот. Все это говорит в пользу введения в КММППР векторного маркера при оценке данных.
Введение в КММППР связи между ДП и КПП показывает возможность переноса в КПП некоторой важной информации о навыках и отражает генетическую связь поколений. Так, в частности, в опытах на мухах дрозофилах и мышах была показано, что у последующего поколения повышается скорость научения навыков конкретной реакции на ситуацию, при наличии таких навыков у предшественников [7, 40]. С учетом принципа редукции, можно предполагать подобное генетическое сохранение навыков у человека. Так, например, учеными из Университета Тель-Авива высказано предположение о наличии в живых организмах набора генов, регулирующих наследование поколениями опыта взаимодействия с внешней средой, и, в частности, гена, связанного с памятью о ранее перенесенном сильном чувстве голода. По их представлению, этот механизм может влиять на «включение» или «отключение» эпигенетического наследования какого-либо травмирующего опыта [41].
В раннем возрасте у человека, при малом объем знаний, подобно этому и для СИИ в начале формирования моделей знаний, при оценке входной информации используются базовые эмоции, хранящиеся в КПП, и реакция происходит автоматически по имплицитному пути. Но в дальнейшем, по мере обработки поступающих данных, с помощью ВП формируются в памяти более сложные эмоции, и выработка реакции в СПР может происходить осознанно по эксплицитному пути. Таким образом, субъектная модель решения (СМР) – первоначально строится по вектору эмоций малой размерности, например, по приведенным выше шести базовым эмоциям [30], а со временем, на основе своего субъективного опыта, формируется многокритериальная база оценок в виде многомерного эмоционального вектора, что эквивалентно переходу от категорий логики Аристотеля к категориям нечеткой логики. С помощью СМЗ происходит выработка субъектной модели решений (СМР) и на ее основе сигналы реагирования, и многокритериальные оценки служат в качестве оценок рассогласования между СМЗ и реакцией внешней среды. На основании этих оценок происходит корректировка СМЗ. Выработка откорректированной СМЗ возможна и по внутреннему контуру системы путем поступления информации в СА с КП, ВП и ДП.
В СПР происходит преобразование множеств СМН и СМЗ в множество СМР. При поступлении входного сигнала, для выработки решения, СПР регулирует два имеющихся у системы механизма реагирования – автоматический, на основе СМН имплицитной памяти, и более сложный механизм осознанной обработки на основе СМЗ эксплицитной памяти. При этом готовый быстро откликнуться на входной сигнал автоматический механизм может быть заблокирован, при некоторой степени неуверенности в решении на основе СМН по отношению к входному стимулу, и будет включен значительно более длительный механизм эксплицитной обработки данных. В этом случае СПР через СА будет управлять процессом формирования более достоверной СМР до тех пор, пока не будет, с его позиции, адекватной СМР, после чего формируется сигнал реагирования.
Элементом осознания при эксплицитной обработке будет реакция мозга на запрос о непоступлении автоматической реакции на раздражитель, поясняющая что надо подождать, так как по эксплицитному пути формируется более сложная СМР, выработка которой на порядок дольше имплицитной реакции.
В зависимости от состояния системы St и поступающих данных Pt, с помощью СПР, из множеств всех возможных СМН и СМЗ производится формирование допустимого множества СМРw, путем обработки каждого вектора СМРj множества всех решений СМР с помощью адаптивной динамической нелинейной весовой функции, представляемой в виде вектора Wa. Весовой вектор Wa вырабатывается в СПР на основании текущего состояния субъекта и имеющихся у него ресурсов, допустимого времени на реагирование, горизонта планирования и других важных факторов. В результате поэлементного перемножения всех векторов СМРj СМР на вектор Wa для дальнейшего анализа получаются вектора СМРwj
СМРwj = Wa .* СМРj, (4)
где .* – символ операции поэлементного перемножения векторов.
СМРwj СМРw (5)
Из множества СМРw операцией выбор Sel отбирается доминирующее множество решений СМРd, например, оптимальное по Парето множество.
СМРd = SelСМРw. (6)
После этого из множества СМРd производится, иногда достаточно трудный, выбор окончательного решения, как, например, это делается в [42] при решении многокритериальных задач, и далее запускается механизм реагирования.
При поступлении входного сигнала, по которому на выходе ЧВФ происходит превышение порога тревожного состояния, в СПР формируется состояние повышенной готовности системы. В этом случае, требование к порогу достоверности СМР будет снижено и за счет изменения весового вектора Wa сигнал реагирования в СПР может быть выработан быстрее.
При накоплении информации в кластерах ВП происходит усложнение СМЗ и увеличение их емкости. Формирование таких СМЗ в конкретной области деятельности человека, в течение достаточно длительного времени, приводит к образованию экспертных знаний. И по приведенной в [13] оценке количество простейших первоначальных чанков информации для одной области деятельности может составлять от десятков тысяч до 1 млн. В результате достоверность вырабатываемых экспертом решений в конкретной области значительно выше, чем у непрофессионала.
Накопленные в ВП устойчивые СМЗ фиксируются в ДП, при этом в связи с их сложностью они уже будут носить подсознательный характер и не поддаются вербализации [43]. Доступ к таким знаниям, в отличие от доступа к ВП, достаточно быстрый [44], в виду их хранения в ДП. В [43] также предполагается, что для быстрого поиска знаний производится их индексация.
В силу сложности осознания данных, хранящихся в ДП, и быстроту доступа к ней ДП отнесена к хранилищу имплицитной памяти.
На рис. 3 представлено формирование СМР по поступающим входным паттернам сигналов (ВxП).
Рис. 3. Сетевая модель последовательности преобразования входных паттернов в СМР
Из входных паттернов по верхнему пути, показанному на рисунке, формируются СМЗ, которые используются для выработки решения. По мере накопления знаний будет происходить переход эксплицитных знаний в имплицитные навыки, и формироваться субъектные модели навыков. В дальнейшем для подобных паттернов процедура выработки решения будет производиться по нижнему значительно более быстрому пути на основе СМН. Так осуществляется эволюционная цепочка восприятия информации как Неосознанная – Осознанная – Подсознательная. Здесь, в частности, можно говорить о первичности интеллекта по отношению к выработанному на его основе вновь приобретенному инстинкту.
Исходя из изложенного, интеллектуальные системы, для которых важна оперативность и ситуативная достоверность в выработке и принятии решения, могут работать следующим образом. При поступлении сигнала формирование и принятие решения производится одновременно двумя путями по имплицитному и эксплицитному. На СПР первым поступает по наиболее быстрому имплицитному пути один из вариантов стереотипных решений и, при высокой оценке достоверности ожидаемого результата по отношению к сигналу, по этому варианту формируется сигнал реагирования. При низкой оценке достоверности результата имплицитный путь блокируется, и используются варианты решений, поступающие по более длительному эксплицитному пути. Если снова оценка достоверности результата окажется недостаточной, то включается механизм экспериментирования на основе проб и оценок результатов экспериментов. С его помощью итерационно вырабатывается адекватное ситуации решение с использованием, как эксплицитного, так и имплицитного механизмов.
В технических системах нижний путь может служить для решения задач многопараметрической оптимизации, а верхний для решения абстрактных задач, многокритериальной оптимизации и подготовки решений в условиях неопределенности. Нижний путь успешно развивается в сложных технических системах. Дополнительное использование верхнего пути наделит их искусственным интеллектом и в совокупности получится система, способная решать многокритериальные, многопараметрические задачи и задачи, обусловленные неопределенностью ситуации.
С увеличением объема памяти научения СПР чаще опирается на имеющийся опыт и использует уже готовую СМР и, таким образом, не стимулирует СА на выработку высокой эмоциональной оценки для вновь поступающей информации. Такое поведение СПР не способствует новому научению и соответствует выводам, сделанным в [6, 45] о том, что накопленный большой опыт мешает формированию новых знаний. Возможно, это связано и с тем, что уже не хватает ресурсов совокупности нервных клеток для генерации новых СМЗ.
В адекватно реагирующих системах на сигналы из внешней среды, при выработке СМЗ, используются подходы на основе свойств:
редукционизма, позволяющего формировать СМЗ более высокого уровня на основе более простых, используя их функциональное подобие [7, 40, 46];
эмерджентности [40, 47], за счет которой формируются более сложные модели знаний, приводящие к их новым неаддитивным свойствам и позволяющей вырабатывать неординарные знания;
стремление к наименьшему действию [48], в рассматриваемом случае, нацелено на минимизацию комплекса затрат по поддержанию робастного гомеостаза;
действий, путем проб и оценок [6], для расширения эффективно доступной части ресурсной базы и ее освоения, а также в случае неопределенности ситуации.
Стремление к наименьшему действию и механизм проб и оценок заложены в генетические коды человека и позволяют избегать его виду сингулярности [28, 30], грозящей его уничтожению, делая вид более устойчивым к окружающей социальной и природной среде, что также полезно при построении сложных технических систем. Если эти свойства в объединении сложных систем нарушаются, то происходит разбалансировка такого объединения и оно распадается.
Все эти свойства коррелированы в процедуре выработки адаптивных и усложняющихся по мере научения СМР. Редукционизм отражает элементную базу системы. Эмерджентность — формирование связей, а стремление к наименьшему энергетическому состоянию и механизм проб и оценок отражают динамическую устойчивость и изменчивость элементов и связей.
ВЫВОДЫ
Предложенная комплексная субъектно-ориентированная компьютерно-мозговая модель работы памяти, научения и принятия решений, а также приведенная информация позволяют усовершенствовать процедуру создания сложных технических систем, в том числе систем интеллектуального анализа данных, включая субъектно-ориентированные базы данных, и СИИ, работающих в условиях неопределенности, для которых важна оперативность и ситуативная достоверность в принятии решений.
КММППР, учитывающая ограничения по емкости КП и увеличенное время распознавания и извлечения новых знаний из ВП, по сравнению с имплицитной обработкой, также может быть использована при анализе процессов научения человеком, использования памяти и принятия им решений и практическом использовании данных этого анализа, и может быть полезна при создании модели мозга человека.
БИБЛИОГРАФИЯ
- Witten, I. H. Data mining : practical machine learning tools and techniques.—3rd ed. / Ian H. Witten, Eibe Frank, Mark A. Hall — Morgan Kaufmann, 2011.
- Anderson J. R. Cognitive psychology and its implications/ John R. Anderson — Worth Publishers, 2005.
- Thinking: psychological perspectives on reasoning, judgment and decision making /edited by David Hardman, Laura Macchi. — John Wiley& Sons, Ltd., 2003.
- Haykin S. Neural network and learning machines / Simon Haykin. – 3th ed – Prentice Hall, 2009.
- Ruaro M.E., Bonifazi P., Torre V. Toward the Neurocomputer: Image Processing and Pattern Recognition With Neuronal Cultures // IEEE Transactions on biomedical engineering, 2005 — V. 52, N. 3 — Pp. 371-383.
- Minsky M. The Emotion Machine — N.Y.: Simon and Schuster, 2007.
- Kandel E. R. In Search of Memory: The Emergence of a New Science of Mind — N. Y.: W. W. Norton & Company, 2007.
- Shelepin J.E., et al. Localization opponenting decision-making mechanisms in the frontal cortex / The fifth international conference on cognitive science. Kaliningrad, Russia — June 18–24, 2012 — V. 2 — Pp. 841-842.
- Moroshkina N.V., Ivanchov I.I. The interaction of implicit and explicit knowledge in the process of learning: what kind of knowledge is more important? / The fifth international conference on cognitive science. Kaliningrad, Russia — June 18–24, 2012 — V. 2 — Pp. 540-542.
- Solso R.L. Cognitive psychology. — Boston : Allyn and Bacon, 2001.
- Atkinson, R. C., Shiffrin, R. M. Human memory: A proposed system and its control processes // The psychology of learning and motivation (Vol. 2). — New York: Academic Press, 1968. — Pp. 89–195.
- Miller G.A. The Magical Number Seven, Plus or Minus Two // The Psychological Review, 1956, vol. 63.- Pp. 81-97.
- Simon H.A. How big is a chunk. Science. 1974. N 183 — Pp. 482-488.
- Cowan N. The magical number 4 in short-term memory: a reconsideration of mental storage capacity. Behav Brain Sci.2001 Feb;24(1): Pp. 87-114.
- Glassman R.B. Topology and graph theory applied to cortical anatomy may help explain working memory capacity for three or four simultaneous items. Brain Res Bull.2003 Apr 15;60 (1-2): Pp. 25-42.
- 16. Piazza M., Mechelli A., Butterworth B., Price C.J. Are subitizing and counting implemented as separate or functionally overlapping processes? NeuroImage 15. Pp. 435–446 (2002).
- Kaufman E. L., et al. The discrimination of visual number. Am. J. Psychol. 62: 1949. Pp. 498–525.
- Milner B. Memory and the medial temporal regions of the brain / In: Biology of memory — N.Y.: Academic Press, 1970.
- Logic R.H. The Seven Ages of Working Memory / In: Working memory and human cognition — N. Y.: Oxford University Press — 1996. — Рp. 31-65.
- Baddeley A.D., Hitch G.J. Working memory / In: Recent advances in learning and motivation — N. Y.: Academic Press, 1974. — Vol. 8. — Pp. 47-90.
- Baddeley A.D. The episodic buffer: A new component of working memory? / Trends in Cognitive Sciences — 2000. — Vol. 4. — Pp. 417–423.
- 22. Schmidt R.F., Thews G. (eds.), ed. Human Physiology. Berlin. Springer-Verlag. – 1989.
- Damasio, A. Descartes’ Error: Emotion, Reason, and the Human Brain. N. Y. Avon Books. 1994.
- Bechara A., Damasio H., Damasio A.R. Decision Making and the Orbitofrontal Cortex / Cereb. Cortex — 2000. — Vol. 10. № 3. — Pp. 295-307.
- Bechara A., Damasio H., Damasio A.R. Role of the Amygdala in Decision-Making / Ann. New York Academy Sci. — 2003 — Vol. 985. — Pp. 356-369.
- Kensinger E.A. Emotional memory across the adult lifespan / Psychology Press.Taylor & Francis Group — N. Y. — 2009.
- Gross J.J. Emotion Regulation in Adulthood: Timing is Everything / Current Directions in Psychological Science –
- — Vol. 10. № 6. — Pp. 214-219.
- Козлов М.В. Штучні емоції в об’єднаннях штучних інтелектів/ Вісник ЖДТУ/ Технічні науки. 3(62). 2012. – С. 99 – 106.
- Damasio A. Self Comes to Mind: Constructing the Conscious Brain. Pantheon. 2010.
- Козлов М. Искусственные эмоции в автономных мультиагентных системах. 19-ый сборник статей по материалам 19-ой международной научной конференции «Творческие поиски ученых Израиля и мира сегодня» Ашкелон. Международный центр научных исследоний и практики творчества. 2013. – С. 64 – 73.
- Strack F., Martin L.L, Stepper S. Inhibiting and facilitating conditions of the human smile: a nonobtrusive test of the facial feedback hypothesis. J Personality and Social Psychology. 1988. Vol. 54(5). Pp. 768-777.
- Козлов М.В. Комп’ютерно-мозкова модель пам’яті і прийняття рішень для складних систем // Вісник ЖДТУ / Технічні науки. 2(65). 2013.- С. 95 — 104.
- Hall B.K., Pearson R.D., Muller G.B. Environment, Development, and Evolution: Toward a Synthesis. MIT Press, 2004.
- D’Urso A., Brickner J.H. Mechanisms of epigenetic memory. Trends Genet. 2014 Jun; 30(6): Pp. 230–236.
- 35. Hierarchical Temporal Memory including HTM Cortical Learning Algorithms, Version 0.2.1, September 12, 2011, Numenta Inc. 2011.
- Зигмунд Фрейд. Введение в психоанализ. Изд-во: «Азбука». 2015.
- Carpenter G.A., Grossberg S. Adaptive Resonance Theory / The handbook of brain theory and neural networks. Ed. Michael A. Arbib — Massachusetts Institute of Technology. 2003. — Pp. 87-90.
- Козлов М.В. Спосіб формування пам’яті у системах штучного інтелекту // Вісник ЖДТУ / Технічні науки. 2(61). 2012. – С. 154 – 158.
- Dunsmoor J.E, et al. Emotional learning selectively and retroactively strengthens memories for related events. Nature. 2015. Pp. 345-348.
- Dudai Y. Memory From A to Z. Keywords, Concepts, and Beyond. – N. Y.: Oxford University Press, 2002.
- Houri-Ze’evi L., et al. A Tunable Mechanism Determines the Duration of the Transgenerational Small RNA Inheritance in C. elegans. Cell. 2016 Mar 24;165(1): Pp. 88-99.
- 42. Козлов М.В. Пошук оптимальних вирішень багатокритерійних завдань // Вісник ЖДТУ/ Технічні науки. – 2011. – № 4 (59). – С. 59–65.
- Kihlstrom J. The Cognitive Unconscious / Science. 1987. – V. 237. – Pp. 1445–1452.
- Ericsson K.A., Lehmann A.C. Expert and exceptional perfomance: Evidence of maximum adaptation on task constraints / Annu. Rev. Psychol. 1996. – № 47. – Pp. 273–305.
- 45. Clarke A.C. Profiles of the Future. – London: Pan, 1978. – 235.
- Simon H.A. The human mind: The symbolic level / Proc. of the American Philosophical Society. 1993. – V. 137(4). — P. 638-647.
- Weinstock M. The Architecture of Emergence – the evolution of form in Nature and Civilisation. – N. Y.: John Wiley and Sons, 2010 – P.280.
- Feynman R., Leighton R., Sands M. The Feynman Lectures on Physics. Vol. 2. Addison Wesley, 1964. – P. 536.