Рефлекс


Перебрав разные подходы к пониманию и созданию ИИ, я пришёл к выводу, что интеллект, в конечном итоге, скорее всего, это не более чем конструктор и хранитель комплексных рефлексов. Подтверждению этой идеи и посвящена статья.

Поскольку каждому человеку свойственно переопределять термины по мере необходимости, расширять или сужать их смыслы и понимать под «общепринятыми» словами что-то своё, для начала дадим чёткое, однозначное и исчерпывающее определение тому, что здесь будет пониматься под «рефлексом». В качестве введения приведу цитату из моей любимой книжки Сеченова И.М. «Рефлексы головного мозга» (1866 год):

Повесьте такую лягушку в воздухе и щипните слегка в каком ни на есть месте ее кожу. Мгновенно явится отрывистое отраженное движение, которое прекратится так же быстро, как прекратилось ваше раздражение. Дело другого рода, если вместо щипанья вы будете действовать на кожу лягушки какою-нибудь раздражающею жидкостью, например, серной или уксусной кислотой; тогда раздражение в коже продолжительно, и вместо одного отрывистого движения вы видите ряд таких движений, продолжающийся более или менее долго. Эти два простых опыта отвечают на первые два пункта, но в то же время они уже родят мысль и о целесообразности отраженных движений. Последний характер выражается особенно резко в явлениях чихания, кашля и рвоты. Во всех этих случаях исходной точкой явления бывает чувственное раздражение: слизистой оболочки носа — при чихании, гортани — при кашле, задней части полости рта — при рвоте; концом же — отраженное сложное мышечное движение, преимущественно в мышцах грудной клетки и брюшной полости. Каждым из этих сложных движений достигается в сущности одна и та же цель — удалить раздражителя. В самом деле, при чихании развивается быстрый ток воздуха в носовой полости, который уносит с собою наружу все, что там есть в настоящую минуту. При кашле бывает то же самое относительно гортани. А рвота, так сказать, обмывает те части полости рта, которых мы не можем обтереть языком. Никому, конечно, не придет в голову оспаривать машинообразность этих явлений, потому что всем известно, что воля не властна над этими движениями; они являются роковым образом, если существует раздражение.

В данном отрывке приводится, казалось бы, частный пример рефлекса, поскольку, как правило, рефлекс описывают как некую реакцию на раздражитель и куда направлена эта реакция не уточняется. Мне думается, что описанная организация рефлекса как реакция направленная на устранение раздражителя носит общий характер, свойственна для всех случаев рефлексов и я постараюсь это показать.
Простейший рефлекс представим следующей схемой:


Р – раздражитель - некий внешний по отношению к рефлексу агент
П – рецептор для данного вида раздражителя
З – знание
М – эффектор, единственной функцией которого является ликвидация (подавление, уменьшение) воздействия раздражителя на рецептор.

Работает такой рефлекс предельно просто и однозначно:
1. Раздражитель, растрачивая свою внутреннюю энергию, раздражает рецептор П.
2. Рецептор П, настроенный на данный вид (тип, класс) раздражителей, растрачивая свою собственную энергию, сообщает знанию о факте своего раздражения т.е. о факте действия раздражителя.
3. Знание, являясь связующим звеном между рецептором и эффектором, растрачивая свою собственную энергию, активизирует эффектор для борьбы с раздражителем.
4. Эффектор, растрачивая свою собственную энергию, ликвидирует влияние раздражителя на рецептор. Ничем другим эффектор не занимается.

Очевидно, рефлекс представляет собой пример отрицательной обратной связи, движимый внутренней активностью, но инициируемый внешней активностью.
Такая базовая конструкция рефлекса непременно должна присутствовать в любом рефлексе, поскольку:
1. Если эффектор будет усиливать влияние раздражителя, система израсходует всю свою внутреннюю энергию и в результате всё вернётся в исходное состояние (если не сломается) т.е. такой рефлекс бесцельный, бессмысленный.
2. Если эффектор всецело будет направлен на что-то иное, а не на устранение влияния раздражителя – раздражитель будет продолжать действие на рецептор и действие знания и эффектора будут нескончаемыми.
3. Если эффектор будет направлен непосредственно на подавление активности рецептора, то рефлекс войдёт в бесконечный цикл и никогда больше не сможет быть возбуждён. А рефлекс ценен как раз своей роковой автоматичностью, который срабатывает по факту раздражения рецептора независимо от других рефлексов. Поэтому принципиально важно отдельное функционирование рецептора и раздражителя.
4. Знание выступает здесь как необходимый связующий элемент, который с одной стороны является своеобразным усилителем сигнала от рецептора, а с другой стороны - факт активизации знания может служить раздражителем для других рефлексов и, соответственно, может подавляться, разрывать рефлекс. А это открывает перспективы для каскадирования рефлексов. Поэтому знание тоже должно быть отдельным элементом.

Рефлекс - это механизм отрицательной обратной связи, единственной целью которого является автоматическая ликвидация раздражителя в ответ на раздражение.

Примеры простых рефлексов мы обнаруживаем в человеке повсеместно:
-свет провоцирует сужение зрачка для уменьшения потока света
-грязь в глазу провоцирует выделение слезы для удаления грязи
-пыль в носу вызывает чиханье для удаления пыли
-преграда в полости рта вызывает рвоту для удаления преграды
-ядовитые вещества в кишечнике вызывают рвоту и понос
-пища во рту вызывает слюноотделение для быстрейшего глотания пищи
-пища в желудке вызывает выделение желудочного сока для скорейшего продвижения пищи
-пища в ДПК провоцирует выделение желчи и сока поджелудочной железы для продвижения пищи
-фекальные массы находясь в клоаке провоцируют акт дефекации
-моча в мочевом пузыре провоцирует акт мочеиспускания
-семя в семенных резервуарах провоцирует половое поведение
-плод провоцирует роды и изгнание плода
-касание к горячему предмету провоцирует одёргивание
-громкий звук из наушников провоцирует скидывание наушников

Самое полезное для решения задачи создания ИИ заключается в том, что даже самые «высокие» проявления психической деятельности человека подчиняются ровно той же схеме:
-желание провоцирует поведение, направленное на уменьшение желания
-противоречие провоцирует поведение для устранения противоречия
-задача провоцирует поведение для решения и устранения задачи
-конфликт провоцирует поведение для разрешения конфликта.

Из этих обобщённых примеров следует, что в общем случае раздражитель может представлять собою не предмет «внешнего мира» (грязь, еда и т.п.), а некоторую раздражающую сущность, созданную внутри нашей психической реальности. Логично допустить далее, что эта внутренняя сущность, в свою очередь, раздражает не телесный рецептор, а некий «внутренний рецептор». И, соответственно, для своей ликвидации требует некий «внутренний эффектор». Рефлексия - восприятие, осознавание своих собственных мыслей – свидетельствует о возможности вырабатывать реакции на внутренние состояния своей собственной психики – рассматривать внутренние состояния психики как раздражитель. Таким образом, рефлекс может быть построен в отношении любого выделяемого состояния психики и позволяет вырабатывать любую реакцию на любое состояние.

В зависимости от происхождения раздражителя мы можем вырабатывать рефлексы на некие статические свойства (цвет), динамические свойства (уменьшение/увеличение), промежуток времени, противоречие и т.д.

В жизни повсеместно встречается ситуация, в которой для решения некоторой над-задачи (ликвидации раздражителя) нужно решить суб-задачу(и). Вероятно, для формирования такого поведения в психике формируются комплексные рефлексы вроде такого:


Рефлекс слева, в ответ на раздражение, своим эффектором возбуждает раздражитель соседнего рефлекса (справа). Рефлекс справа, в свою очередь, подавляет свой раздражитель и заодно подавляет раздражитель соседнего рефлекса (слева). Т.е. один и тот же эффектор подавляет несколько раздражителей.
Проиллюстрировать такую конструкцию можно простым примером. Чтобы почесать затылок (раздражитель слева) мы начинаем хотеть подвигать рукой (хотение в таком случае – раздражитель справа). Чтобы удовлетворить хотение «подвигать рукой» мы двигаем рукой (срабатывает эффектор правого рефлекса) но одновременно с этим мы ликвидируем и первый раздражитель (чесотку). Ясно, что в общем случае таких звеньев может быть больше двух, но справа он оканчивается либо непосредственно мышцей либо ожиданием чего-то. Это важный момент.

Видимо именно в силу такой базовой архитектуры комплексного рефлекса человек всегда может объяснить за-чем (за каким рефлексом) (почему, для чего, с какой целью) он позволял себе то или иное поведение, а это значит, что у каждого рефлекса должен быть рефлекс-родитель, у которого, соответственно, есть однозначный раздражитель.

Если нам удастся создать автоматический конструктор рефлексов, который будет строить комплексные рефлексы из простых рефлексов то, вероятно, мы сможем добиться поведения схожего на целенаправленное рациональное поведение человека. Для этого посмотрим, какие этапы должны быть пройдены для создания рефлекса.

Чтобы создать рефлекс, необходимо определить каждый из 4-х составляющих рефлекса: раздражитель, рецептор, знание и эффектор. Начнём с конца. Как правило считается, что эффектором выступает только мышца, эта ситуация всем известна и на ней часто заостряется внимание. Однако очень часто случается, что для ликвидации некоторого раздражителя нет нужды привлекать собственные мышцы, достаточно, например, просто подождать пока некие внешние силы (раб, силы природы, искусственные механизмы и т.п.) сделают дело по ликвидации раздражителя. Но это значит, что в качестве эффектора в данном случае выступает не мышца, а некий внутренний «психический» эффектор, который активизируется не знанием, а органами чувств.

Теперь о раздражителе. Всем понятен и очевиден пример с тем, когда раздражителем является некий предмет «внешнего мира». Но намного чаще мы сами оказываемся авторами раздражителей, устранение которых ведёт нас по жизни и формирует наше поведение. Например, идея «создать ИИ» становится раздражителем как только мы дизассоциируем себя и саму эту идею, сделаем её «внешней», противопоставим себя и её и заставим идею быть активным раздражителем для нашего "внутреннего восприятия". В этом месте важно понять, что в момент дизассоциации совместно с раздражителем должна возникнуть дополняющая её пара – рецептор, некое внутреннее око, которое будет настроено на данный раздражитель и именно это «око» будет требовать привязать к себе некое знание для подавления раздражителя. Возможно, в этом кроется секрет возникновения сознания, самосознания и рефлексии.

Будущее (ожидание) как раздражитель.
Мы осознаём свои планы, поскольку некая мысль, будучи созданной в качестве плана будущего, тут же может дизассоциироваться и стать раздражителем, тем самым провоцируя процессы для своей ликвидации, т.е. для достижения этого будущего. Как только мы выполняем свои планы - они исчезают, поскольку перестают нас раздражать. Восприятие факта выполненности планов становится тем эффектором, который их подавляет. Именно тот факт, что наши планы сугубо автоматически исчезают в момент их выполнения свидетельствует в пользу того, что такой автоматизм стал результатом работы заранее сконструированного нашим сознанием рефлекса. Это же, снова, указывает на то, что рецептор, расположенный на теле, может играть роль эффектора для подавления раздражителя, созданного «внутри». В таком случае одни рецепторы, расположенные на теле, могут своё возбуждение преобразовывать по цепочке во внутренний рецептор, а другие внешние рецепторы в то же самое время могут преобразовываться во внутренние эффекторы для подавления внутренних раздражителей.

Через ожидания, которые мы сами себе создаём, мы позволяем миру выборочно управлять нами. Например, мы хотим открыть дверь, наше сознание соорудило комплексный рефлекс и рука тянется к двери, чтобы ликвидировать это наше хотение. Мы создали образ открытой двери (или опущенной ручки) как ожидание, которое, будучи достигнутым (будучи увиденным), сработает как эффектор и подавит это ожидание (как раздражитель). Теперь допустим, что в этот самый момент с другой стороны двери кто-то открыл дверь, наше ожидание удовлетворилось раньше времени и наша рука мгновенно остановилась – сработал пред-уготовленный нами эффектор в виде ожидания, в данном случае мир явно управлял нами через наше ожидание.

Другой простой пример. При чихании возникает характерный звук, который либо врождённым либо приобретённым образом (этого я ещё не выяснил, но не суть важно) становится ожидаемым и ощущаемым результатом чиханья. Т.е. помимо ликвидации воздействия грязи на рецепторы слизистой оболочки носовой полости, чиханье ликвидирует так же ожидание звука чиханья как раздражитель. Теперь, если рядом расположенный человек только собрался чихнуть и мы воспроизведём звук чиханья - его рефлекс чиханья будет подавлен. Точно так же как в примере с дверной ручкой внешняя сила управила нашим рефлексом.

Теперь мы можем более детально нарисовать комплексный рефлекс, который работает, когда мы чешем в затылке:


Внимание на себя обращает следующее.
1. Мышца выполняет роль как эффектора (т.к. она физически ликвидирует грязь – первичный раздражитель), так и роль раздражителя, поскольку возбуждает рецепторы на теле (тактильные рецепторы, глаза, уши и т.п.).
2. Рецептор мышечного чувства выполняет роль эффектора, поскольку подавляет раздражитель «желание пошевелить рукой» (оправдывает это предсказание, ожидание), однако желание шевелить рукой возбуждается снова, поскольку первичный раздражитель (грязь) не убран.
3. Созданные промежуточные внутренние раздражители («чесотка» и «желание почесать») могут быть ликвидированы только изнутри либо путём ликвидации первичного раздражителя либо путём создания специфических рефлексов для подавления именно данных внутренних раздражителей. В связи с этим возникает замечательное предположение о том, что сон является ни чем иным, как процессом подчистки «мусора» - ликвидации обрывков созданных рефлексов, которые остались активны, хотя раздражители, вызвавшие их, в силу тех или иных посторонних обстоятельств были убраны. А поскольку большинство таких junk-рефлексов между собой тематически никак не связаны, то и сновидения выходят маргинально эклектическими.
4. Из схемы явно следует, что рецепторы на теле могут полноценно выполнять функцию эффекторов для ликвидации внутренних желаний. Например, хочу велосипед - подарили мне велосипед – я увидел свой велосипед – больше не хочу велосипед.

Если мы вольны сами создавать свои рефлексы то, казалось бы, любую созданную нами сущность можно подавить, создав нами же соответствующий простейший рефлекс. Однако как показывает практика во многих случаях внутренний раздражитель, как начало некоторого рефлекса, возбуждается независимыми от нас раздражителями. Например, можно было бы подавить чувство голода как раздражитель и не кушать, однако через определённый промежуток времени внутренние физиологические процессы пересилят сознание и снова поставят перед ним задачу утолить голод. Или можно было бы отказаться от идеи создания ИИ (создать внутренний простой рефлекс, который подавлял бы мысли об ИИ, как только они появляются как раздражители) и заняться чем-то другим (подавлением других раздражителей), однако другие внешние раздражители, требующие для своей ликвидации именно ИИ (например, производственные задачи, проблематика выживания в сложном мире, подряд заказчика и т.п.) раз за разом роковым образом активизируют (раздражают, провоцируют) процессы активации внутреннего раздражителя (желания создать ИИ) и построения соответствующего рефлекса именно через внешнее долгоживущее решение, а не через простое внутреннее подавление.

В какой момент и при каких условиях возникает рефлекс?
1. Врождённый рефлекс закодирован в ДНК и воплощается соматически без какого-либо вмешательства извне. Примером такого рефлекса может быть чиханье.
2. Наработанный и срабатывающий всегда в определённых условиях. Например, при необходимости поездки в метро у нас возникает рефлекс покупки жетона. Возникает желание купить жетон, которое не проходит, пока мы не купим жетон.
3. Оперативно созданный только что «одноразовый» рефлекс. Судя по всему, в этом постоянном упреждающем формировании рефлексов и состоит главная (а может единственная?) функция сознания. Выбирая по некоторому принципу раздражитель, сознание связывает с ним через знание, выбранный по некоторому принципу, эффектор и отпускает новосозданный таким образом рефлекс «на волю» для дальнейшего автономного функционирования либо сейчас либо в будущем (построение планов, как уже было сказано – это построение рефлексов прозапас). Здесь важно отметить, что механическая работа членов собственного тела, с точки зрения сознания, совершенно автоматична и имеет «внешний» характер, точно так же как работа ветра, Солнца, гравитации, тел посторонних людей, электронных приборов и т.д. После создания рефлекса он будет срабатывать автоматически при наличии раздражителя и всё что в дальнейшем может сделать сознание для управления этим рефлексом – это оперативно создать ещё один рефлекс, который будет подавлять первый рефлекс, как раздражитель.

Если один и тот же рефлекс синтезируется часто, то он переходит в категорию 2 и становится «наработанным и срабатывающим всегда в определённых условиях». Кроме того, такой рефлекс пополняет список доступных эффекторов и может включаться сознанием в более комплексные рефлексы. В качестве частного случая может, очевидно, создаваться рефлекс для того, чтобы останавливать (подавлять) какой-то «раздражающий нас неправильный» наш же собственный рефлекс.

Принцип, по которому сознание выбирает раздражитель, выглядит, наверное, примерно так. В данный момент времени существует некий раздражитель, который нас раздражает. Если нет иного, более сильного раздражителя, сознание автоматически берётся за конструирование рефлекса по уничтожению этого Главного (доминантного) раздражителя. Чтобы выбрать соответствующий эффектор из всего множества эффекторов нужно чтобы эффекторы были упорядочены по принципу «какой эффектор какой раздражитель в каких условиях уменьшает». Такая таблица, видимо, пополняется постоянно из анализа происходящих событий и составляется автоматически в привязке ко всяческим дополнительным условиям (один и тот же раздражитель в разных условиях, очевидно, может подавляться по разному). Понятно, что не всегда эффектор в данной таблице – это мышца нашего туловища. В общем случае эффектором может быть всё что угодно, что может быть выделено рецепторами как некая самостоятельная сущность, которая по итогам наблюдений уменьшает тот или иной раздражитель. Возвращаясь к вышенарисованной схеме многоступенчатого рефлекса в случае, когда эффектор является некоторой «внешней» сущностью (сила природы, раб и т.д.), сознанию, конструирующему рефлекс, подавляющий раздражитель посредством такого «внешнего эффектора», после создания рефлекса и отпускания на волю остаётся только ждать. Однако даже если рефлекс оканчивается локомоцией собственной мышцы, сознанию, в конечном итоге, тоже остаётся только ждать т.к. при исполнении рефлекса своё туловище становится таким же внешним агентом, как и любая внешняя сила природы.

Из всего сказанного ясно, что помимо очевидной схемы рефлекса: «внешний раздражитель – внешний эффектор» (в том числе эффектор своего тела), можно чисто условно различить 3 разновидности рефлексов:
«внутренний раздражитель – внутренний эффектор» (подавление своих внутренних желаний силой своей же воли),
«внешний раздражитель – внутренний эффектор» (терпение действия внешнего раздражителя),
«внутренний раздражитель – внешний эффектор» (реализация своих желаний через внешние эффекторы – свои мышцы или другие силы природы, которые наблюдаются рецепторами).

Часто случается так, что некий внешний раздражитель воспринимается нами как результат работы некоторого комплексного внешнего рефлекса и мы можем выявить цепочку внешних раздражителей, которые виновны в раздражении Главного раздражителя и тогда справедливо поставить задачу о подавлении опосредованного виновника-раздражителя.

Простой пример постоянно создаваемого сознанием рефлекса – это речь. Очевидно, что в процессе говорения человек слушает сам себя и после произнесения некоторого слова он не повторяет его дважды, трижды и т.д. После произнесения слова – говорение этого слова заканчивается автоматически. Кроме случаев, если слово было произнесено неверно (в силу какого-то раздражителя сработал какой-то другой автоматический рефлекс, было произнесено другое слово и в результате наш первичный раздражитель остался активным). Это значит, что при говорении всегда сначала создаются: раздражитель – желание сказать некое слово; рецептор на этот раздражитель; запускаются эффекторные механизмы. Часто мы видим ситуацию, если человека в разговоре перебили, он непременно хочет «высказать свою мысль» после наступления паузы в разговоре причём именно теми словами, которые он задумал (рефлексы на которые он сформировал) поскольку так он проще всего подавит созданные раздражители. В этом смысле любопытно отметить использование слов «да/нет» как вырожденных универсальных эффекторов для подавления или неподавления каких-то словесных рефлексов слушателя.

Любое воспоминание, судя по всему, есть возбуждение внутреннего раздражителя в ответ на внешний раздражитель (запись, вопрос и т.п.). Отсюда можно сделать заключение, что суть запоминания сводится к каскадированию раздражителей или более сложному сочетанию рефлексов. Планирование состоит в том, чтобы подготовить свои реакции на все возможные раздражители, которые могут встретиться на пути подавления некоторого главного в данный момент раздражителя (задачи). А подготовить реакции, это значит пред-положить в свою память то, что необходимо вспомнить в некоторой ситуации. А это значит, что планирование состоит исключительно в подготовке рефлексов. Например, я хочу поехать в другой город. Чтобы подавить это хотение я формирую план (т.е. готовлю свою память к встрече с возможными раздражителями). Например: «если я приду на вокзал и билетов не будет, то нужно брать билет на самолёт». Как правило, таких «домашних заготовок» хватает для типичных ситуаций. Но если ситуация (раздражитель) нетипична то в момент её возникновения сознание активно формирует рефлексы «с колёс» и готовит прозапас рефлексы на будущее, самопрограммируя свои реакции. Попутно отметим, что конструкция «если… то…» - это вербальное отображение простейшего рефлекса.

Правильно всё то, на что создан рефлекс. Сам факт наличия рефлекса свидетельствует о том, что это и есть источник правильности. Если рефлекс подавлен – значит он признан неправильным.

Возможно в глобальном смысле справеделиво, что каждый человек, в зависимости от своей философии, стремится подавить (уничтожить, ликвидировать) свой Главный раздражитель: материалист – мир, солипсист (идеалист) – себя.

Из предложенной схемы опасения по поводу угрозы ИИ для человечества из интуитивной идеи становится совершенной ясной. Если человечество даёт искусственному интеллекту, как своему рабу, команды для исполнения то в определённый момент развития ИИ сможет понять, что Главным раздражителем является не команда, даваемая человеком, а сам человек...

Технология обучения

Для ручных экспериментов возьмём простейшую (с моей точки зрения) интеллектуальную задачу – научить точку перемещаться из пункта М в пункт Б по команде. Роль точки будет играть фишка (красный кружок) на клетчатом поле. У каждой клетки свой уникальный «ландшафт» эмулируемый буквой.



Прикрутим фишке для начала рецепторы «ландшафта». Каждому «ландшафту» соответствует свой отдельный рецептор. Т.е. то, что для нас, наблюдателей, будет выглядеть как перемещение фишки с клетки на клетку, для самой фишки будет выглядеть как ослабление активности одних своих рецепторов и усиление активности других. Понятно, что это «заглушка» для полноценного распознавания, но для начала нужно зацепиться за что-то простое, а потом, поняв общий принцип, возможно, удастся сделать и идеологически корректное достаточно простое распознавание, не выходя за рамки принципа рефлекса, взятого здесь за основное вооружение.

Также сделаем фишке целевой рецептор (сенсор команды), который будем активировать мы (создатели) извне, а подавляться это желание-раздражитель будет только в том случае, если фишка попадёт на целевую клетку - клетку «б». Можно образно представить себе это так, что мы поставим на фишку груз, который будет раздражать некий рецептор, и этот груз может быть сброшен только ландшафтом клетки «б» (например, там низкие потолки). Также прикрепим фишке некое подобие проприорецепторов, чувствующих направление собственного перемещения – вверх, вниз, вправо и влево.

Эффекторов также будет 4 и активация каждого эффектора будет приводить к перемещению клетки на один шаг вверх, вниз, вправо или влево.

Теперь попробуем в общих чертах представить, что же мы хотим получить в итоге.
Допустим, изначально фишка находится на клетке «м», как на картинке.
Активизируем у новорождённой фишки целевой рецептор.

У фишки «tabula rasa» нет никакой возможности применить какой бы то ни было внешний эффектор, чтобы ликвидировать раздражитель целевого рецептора. Единственное что может сделать фишка в таких условиях - попытаться подавить раздражение изнутри. Это значит, что она может дизассоциировать своё ощущение раздражителя и рецептор раздражителя (создать внутренний «буферный» раздражитель - понятие) и подавить его. Для этого она должна создать промежуточный внутренний раздражитель, сконструировать простейший рефлекс и своим внутренним эффектором подавить этот раздражитель. Говоря русским языком – терпеть. В таких условиях мы, экспериментаторы, должны были бы усиливать внешний целевой раздражитель, чтобы фишка не могла его больше терпеть, а начала искать другой рефлекс. Но это пока слишком сложно для наших целей. Поэтому мы, отметив для себя такую возможность на будущее – дизассоциировать и терпеть - для простоты предположим, что фишка не может терпеть и раздражитель настолько сильный, что он пробивает буферный рефлекс и продолжает раздражать ЦНС фишки и требует найти другой путь – другой рефлекс.

Чтобы синтезировать новый рефлекс фишка должна получить какой-то жизненный опыт. Если у фишки вообще нет никаких врождённых рефлексов, то жизненный опыт она может получить только из-за внешнего влияния. Например, мы можем взять фишку и таскать её из клетки в клетку, чтобы она запоминала связи между динамикой изменения разных рецепторов. Но даже если она запомнит связь между целевым рецептором, рецепторами перемещения и рецепторами ландшафта она всё равно не сможет двигаться сама посредством своих эффекторов – у неё не выработаются соответствующие рефлексы. Отсюда сделаем важные выводы:

1. У фишки обязательно должны быть базовые примитивные рефлексы для шевеления собственными эффекторами. В таких рефлексах базовым раздражителем является желание почувствовать движение своего эффектора, которое удовлетворяется движением этого эффектора. Отметим, что, несмотря на то, что эффектор находится во «внешнем мире», фишка всё-равно пользуется данными только своих чувств т.е. неизбежно является солипсистом.
2. Базовым строительным элементом для конструирования сложных рефлексов может быть только готовый цельный рефлекс, а не отдельный эффектор, рецептор или что-то ещё.
3. Коль скоро мы выяснили, что минимальные базовые врождённые рефлексы у фишки должны всё-таки быть, грех этим не воспользоваться и не прикрутить фишке какой-то поисковый исследовательский рефлекс любопытства. Так или иначе, фишке придётся приобретать опыт либо через внешнего учителя (мы будем возить фишку по полю), либо по ходу выполнения каких-то посторонних рефлексов (которых по условию задачи пока нет), либо в силу выполнения врождённого вырожденного рефлекса, единственной целью которого является устранение зуда новизны.

Допустим, что либо путём влияния внешнего учителя (например, даже генератора случайных чисел), либо своего рефлекса любопытства, либо другого постороннего рефлекса, фишка начала исследовать свой мир - что она должна запоминать? Понятно, что коль скоро строительным элементом для комплексных рефлексов являются простые рефлексы она и должна извлекать из своего опыта болванки рефлексов, т.е. связывать рецепторы и эффекторы через создаваемые знания. Люди в своей жизнедеятельности строят рефлексы постоянно и запоминают всё подряд, однако находки, сопровождающиеся эмоциями, запоминаются крепче. В идеале хорошо бы и нашей фишке прикрутить нечто подобное.

Рефлексы будем записывать в простую таблицу такого формата:
интенсификации какого рецептора (предполагаемого эффектора) соответствует прекращение (уменьшение) действия каких рецепторов

Логика здесь простая. Если какой-то эффектор непосредственно после своего действия (или одновременно) уменьшил активность какого-то рецептора, значит есть вероятность того, что здесь есть связь и эффектор устранил раздражитель, действовавший на рецептор и эту связь нужно запомнить, чтобы в следующий раз, в случае необходимости, устранять этот раздражитель этим же эффектором. Составление такой таблицы можно охарактеризовать как подражание, что характерно для человеческих учеников.

Допустим, фишка в процессе любопытствующего блуждания попала на целевую клетку «б» из клетки «е». По условиям задачи в этот самый момент целевой рецептор должен прекратить свою активность (высокие потолки сбросили груз). Это значит, что фишка, удовлетворяя своё любопытство, захотела пойти вверх и, удовлетворяя это своё желание, чисто рефлекторно (автоматически) не только удовлетворила любопытство и желание пойти вверх, но также ушла с клетки «е» (действие этого рецептора также уменьшилось) и выполнила команду (действие целевого рецептора тоже уменьшилось). Поскольку фишка создаёт рефлексы на всё, что смогла увидеть (а видит она всё, ибо всего очень мало), то она обязана создать запись в таблице такого вида:
«вверх увеличилось» и
«любопытство уменьшилось» и
«желание идти вверх уменьшилось» и
«раздражитель «е» прекратился» и
«целевой раздражитель прекратился».

Здесь важно обратить внимание на то, что прекратили своё действие несколько рецепторов одновременно. Фишка не знает, почему «на самом деле» прекратилось действие целевого рецептора, она знает только что если в следующий раз у неё будет такой набор раздражителей, то есть шанс на то, что действие того же эффектора снимет эти раздражители (что ещё раз указывает на исключительно солипсический способ познания мира).

Тут необходимо отметить два важных момента.
1. При таком формате составления таблицы не возникает связи между самой клеткой «б» и снятием целевого раздражителя, т.е. фишка впоследствии не сможет сформулировать себе абстрактную задачу так: «чтобы снять целевой раздражитель, необходимо ожидать попадания на клетку «б». В памяти жёстко закрепляется связь между конкретными условиями устранения целевого раздражителя. И если фишка нашла некий путь к цели она всегда будет как зомби ходить только по этому пути.
2. В силу тех же обстоятельств фишка не сможет включить в комплексный рефлекс промежуточную цель - желание попасть в клетку «е» - поскольку такого рефлекса в таблице попросту нет. Т.е. когда фишка попадала, например из клетки «к» в клетку «е» она ещё не знала, что это приведёт к уменьшению активности целевого рецептора и поэтому она не желала попадать в «е», и поэтому факт уменьшения этого желания (попасть в «е») не будет зафиксирован в таблице, и поэтому факт попадания в «е» зафиксируется в таблице только как факт уменьшения «к».

Это всё наталкивает на мысль, что для максимально эффективного использования жизненного опыта в таблицу необходимо заносить не только фактические снятия фактических раздражителей, но и то, какие желания могли бы быть сняты, если бы фишка их хотела - прозапас откладывать информацию о том, что может понадобится в будущем, а именно записывать не только те рецепторы, которые прекратили свою активность но и те рецепторы, которые увеличили свою активность, с таким расчётом, чтобы эти рецепторы могли быть предположены как эффекторы для удовлетворения желаний при конструировании комплексных рефлексов в будущем. Это вполне соответствует нашему жизненному опыту, когда мы запоминаем всё подряд без разбору и очевидной целевой нужды.

С учётом этого обстоятельства запись в таблице должна выглядеть так:
«вверх увеличилось» и
«любопытство уменьшилось» и
«желание идти вверх уменьшилось» и
«раздражитель «е» прекратился» и
«целевой раздражитель прекратился» и
«уменьшилось желание попасть в «б» (если бы такое желание было)».

Теперь, когда у фишки есть все составляющие комплексного рефлекса мы можем ожидать, что, будучи помещённой на исходную клетку «м» (или любую другую клетку, где фишка уже была), фишка уже безо всякого блуждания и труда сможет сконструировать комплексный рефлекс для попадания в клетку «б» (построить план от цели), гипотезу, которую сможет подтвердить или опровергнуть на практике.

Здесь следует сделать важное замечание и акцентировать внимание на следующем тонком аспекте. В реальных, полевых, а не лабораторных, условиях может случиться так, что кирпичики рефлексов, казалось бы, должны дать правильный исход и достижение цели, но они не срабатывают – возникает ошибка. Почему? Потому что мы никогда не можем быть уверены, что наши знания (запомненные/синтезированные рефлексы) сработают всегда. Возможно, что при получении конкретного жизненного опыта мир «подыгрывал» нам, например, когда фишка, находясь на клетке «е» пошла вверх и попала на клетку «б» то попала она на неё только потому, что некая внешняя сила в этот самый момент подложила клетку «б» в это самое место. Но нет никаких гарантий, что эта же внешняя сила сработает в каждый следующий раз, поэтому по сути любой синтезированный рефлекс всегда является гипотезой ибо всегда существует возможность вмешательства некоторой неучтённой внешней силы в момент получения опыта (обучения) т.е. запоминания «правильного» (на тот момент!) рефлекса.

Продвигаясь по цепочке сконструированного комплексного рефлекса фишка, конечно же, опять получает жизненный опыт и уже не просто запоминает новые рефлексы в таблицу, а пишет их поверх старых, тем самым подкрепляя (или обновляя) свой прошлый опыт. Какой-то специальной проверки старых знаний не происходит. Если вместо старого рефлекса обнаружился новый, то старый должен просто со временем угаснуть. А это значит, что должен постоянно и безусловно происходить процесс перманентного забывания (разрушения) всех рефлексов или только невостребованных рефлексов.

Практическая часть

На основании вышеизложенных идей мною была написана программа искусственного интеллекта.

Работа программы состоит в циклическом выполнения 4-х процедур:
1. Автоматическое срабатывание рефлексов по мере активации соответствующих раздражителей
2. Автоматическое запоминание опыта, полученного вследствие автоматического срабатывания рефлексов
3. Автоматическое построение рефлексов на основе опыта (сознание)
4. Автоматическое забывание рефлексов

Процедура 1 работает предельно просто – при возникновении раздражителя тут же срабатывает эффектор, который прописан в памяти как такой, который устраняет этот раздражитель. У программы «врождено» 5 незабываемых рефлексов:
1. на раздражитель «желание пойти влево» (обозначен как L) срабатывает эффектор «влево» (обозначен как 0), при этом желание идти влево прекращается (строго говоря, это некоторое упрощение, поскольку для прекращения желания идти влево должен сработать проприорецептор, реагирующий на движение влево, и он должен послужить эффектором для подавления желания идти влево, но для наших изысканий не будем пока усложнять, проприорецепторы вводить не станем и будем считать, что эффектор фишки помимо того, что перемещает фишку влево также автоматически снимает желание идти влево).
2. на раздражитель «желание пойти вправо» (обозначен как R) срабатывает эффектор «вправо» (обозначен как 1)
3. на раздражитель «желание пойти вверх» (обозначен как U) срабатывает эффектор «вверх» (обозначен как 2)
4. на раздражитель «желание пойти вниз» (обозначен как D) срабатывает эффектор «вниз» (обозначен как 3)
5. на раздражитель «желание любопытства» (обозначен как *) срабатывает эффектор (обозначен как C от curiosity), который стохастически возбуждает одно из желаний – R, L, U или D, которое, естественно, автоматически рефлекторно в свою очередь удовлетворяется. При этом удовлетворяется и любопытство, как раздражитель. Но если фишка стоит, например, у правого края поля и из любопытства хочет идти вправо, то это её желание удовлетворяется, однако она остаётся стоять на месте.

Процедура 2 работает таким образом. В каждый такт времени процедура отслеживает факт одновременной интенсификации и ослабления каких-то рецепторов. Это и есть причинно-следственные связи практического опыта. В силу простоты модели под интенсификацией понимается появление активности, а под ослаблением – исчезновение. Т.е. интенсивность носит дискретный бинарный характер.
Такая работа процедуры подразумевает, что запоминается всё подряд. Нет способа выяснить до момента запоминания чего-то, что это что-то запоминать не нужно. В более серьёзном интеллекте человека есть предварительные ограничители запоминания, например зона фовеа и внимание. Для наших целей предварительное ограничение не требуется в силу малого объёма сенсорной информации.
Ещё одним упрощением является необходимость одновременного ослабления и интенсификации запоминаемых состояний рецепторов. Человек в этом смысле гибче, он может связывать уменьшение и увеличение чего-то спустя время, например, съел чего-то - через день стало плохо, некоторые люди способны связать эти два события как прямо-обусловленные, причинно-следственные. Хотя это свойственно далеко не всем людям. Многие действуют настолько же тупо как и наша фишка – связывают причины и следствия только при их непосредственной близости во времени.

Процедура 3 обобщает в себе всё то, что мы относим к высшей интеллектуальной деятельности – планирование, прогнозирование, построение планов, творчество, обучение, синтез. Всё что человек создаёт – это рефлексы, срабатывая они реализуют формы поведения, которые, в зависимости от особенностей ситуации, мы называем разными словами, но в сущности любое активное действие (локомоция, прогноз, вспоминание) – есть результат выполнения некоторого рефлекса, есть результат действия эффектора.

Работает сознание нашего ИИ очень просто: исходя из жизненного опыта сознание стремится найти цельный (без разрывов) путь (цепь) из комплементарных пар звеньев жизненного опыта. Где начало следующего звена является концом предыдущего. Ведь чтобы что-то уменьшилось, оно должно сначала увеличиться. Поскольку в жизненном опыте записано также, какое локомоторное желание было при этом одновременно удовлетворено, фишка на основании этой цельной цепи и жизненного опыта строит группу рефлексов с соответствующими эффекторами.

В итоге мы получаем набор сгенерированных рефлексов, в которых раздражителем является некоторая клетка поля. Срабатывая на эту клетку эффектор уменьшает раздражитель и заодно переносит фишку на следующую клетку, в следующий пункт плана. В более продвинутой версии ИИ должно также возникать желание попасть в следующую клетку, которое в свою очередь должно быть раздражителем и устраняться. Но принятое мной упрощение не особо конфликтует с истиной, потому что в жизни мы часто совершаем поступок не потому что точно знаем куда мы хотим попасть, а потому что нам надоело то, где мы есть и мы задумали некое действие для устранения этого раздражителя.

Если сознание фишки не может найти целостный путь (если жизненный опыт не содержит соответствующих звеньев, причинно-следственных связок) и при этом целевой раздражитель продолжает раздражать, то включается желание любопытства – при этом фишка начинает желать стохастически пойти в каком-либо из 4-х направлений. Желание удовлетворяется рефлекторно, поскольку на каждое из 4-х возможных желаний есть врождённый рефлекс. Желание любопытства работает ровно до тех пор, пока не будет получен достаточный жизненный опыт, из которого сознание сможет сложить связную цепочку рефлексов для снятия целевого раздражителя.

Процедура 4 – постоянное забывание - похожа на работу мышцы, если ею работаешь - она растёт и сохраняет свою работоспособность, если не работаешь – мышца теряет воду, белок и свои способности. Так же и созданный рефлекс – если им пользуешься, значит имеет смысл его хранить, если нет – лучше ликвидировать. Ведь как мышца, так и рефлекс в живом организме имеет физиологический материальный носитель, который просит кушать, просит ремонта, занимает место. В идеале время жизни созданного рефлекса должно быть прямо пропорционально частоте его использования. Но для упрощения программы я сделал так, что рефлекс забывается практически сразу после создания и его каждый раз нужно создавать заново.
С точки зрения философии это значит, что ИИ у нас получился с «открытым сознанием», постоянно придумывает себе планы и не зацикливается на привычках, догмах, стереотипах. Это же позволяет ему постоянно быть в курсе последних событий и строить свои планы на основании самого свежего жизненного опыта.

Интерфейс программы предельно простой. Чек-боксом «Целевой рецептор» можно озадачить нашу фишку-рабыню и заставить её что-то делать, чтобы избавиться от назойливого раздражителя. Напомню, что по моей воле, как демиурга этого игрушечного мира, целевой раздражитель автоматически снимается при попадании фишки на клетку «б». Если фишка уже стоит на клетке «б» то возбудить целевой рецептор не удастся. Если целевой раздражитель не активирован, то фишка ничего не делает. Полагаем, что достаточно сильно фишку раздражает только этот раздражитель и только для его ликвидации фишка предпринимает усилия. Понятно, что это сильное упрощение, но для начала сгодится. В идеале фишка должна не только выбирать главный раздражитель из нескольких в каждый момент времени, но и рассматривать возможности применения внешних сил (внешних рефлексов) для их устранения.

Установить фишку на любую клетку можно кликом мышки на поле. При запуске программы фишка находится в клетке «м».

Нажатие на кнопку «Ход времени» единожды прокручивает цикл из 4-х вышеуказанных процедур. Смысл всей затеи состоит в том, чтобы по нажатию на кнопку «Ход времени» фишка получила достаточный жизненный опыт и смогла построить систему рефлексов, которые без стохастического блуждания проведут её из любой клетки поля до целевой клетки «б», которая, в свою очередь, освободит её от раздражителя.

Рекомендуемая инструкция по эксплуатации:
1. Запускаем программу, устанавливаем фишку на желаемую клетку (или оставляем на клетке «м»), включаем целевой рецептор («кладём на фишку груз»).
2. Давим на кнопку «Ход времени» до тех пор, пока фишка путём случайных блужданий ввиду любопытства не попадёт на клетку «б» (пока груз не будет сброшен).
3. После этого помещаем фишку на какую-то другую клетку, снова включаем целевой рецептор и снова жмём кнопку.
4. В процессе наблюдаем за качественным изменением поведения фишки и за ходом наполнения её базы знаний. При стохастическом блуждании фишка не пользуется своим опытом (т.е. может повторять то, что она уже делала). Сделано это специально, чтобы подчеркнуть ощутимую разницу между эффективностью случайного блуждания и выполнением плана рефлексов.
Кроме того, фишка не хитрит, и если у неё есть опыт попадания, например, с клетки "а" в клетку "б" путем движения вправо, то фишка ничего не может сказать о том, попадёт ли она с клетки "б" в клетку "а" если пойдёт влево, если у неё нет такого жизненного опыта.
Обращаю особое внимание на то, что нажатие на кнопку «Ход времени» не является вмешательством в «мозги» ИИ извне. Единообразное нажатие на кнопку приводит к разнообразному поведению фишки. Кнопка введена только для того, чтобы можно было пошагово следить за процессом обучения фишки (само-обучения, если хотите).

Итог.
По моему скромному мнению, рефлекс вполне оправдывает себя как центральный механизм для создания искусственных интеллектов. В тестовой программе удалось реализовать все необходимые элементы интеллекта в минимальной, но достаточно функциональной форме. Это врождённые рефлексы, запоминание опыта, создание рефлексов на базе опыта, достижение заданной извне цели (выполнение команды), внутренняя активность. Лично у меня к этой программе нет идеологических и архитектурных претензий. Её главный недостаток – это вырожденная простота. Но это же её главное преимущество.

Обсуждение на "GotAI"