Критика искусственного разума
ОТ ИЗДАТЕЛЬСТВА
Книга американского философа Хьюберта Дрейфуса посвящена методологическим проблемам кибернетики, точнее, вопросу о возможностях и пределах машинной имитации и "усиления" человеческого разума. В научной литературе эта область исследований известна как кибернетическое моделирование познавательных процессов и разработка систем "искусственного интеллекта". Под последним понимаются системы, которые по некоторым своим характеристикам существенно приближаются к процессам функционирования чисто человеческих феноменов восприятия и мышления и их проявления в разумном поведении.
Следует подчеркнуть, что в нашей стране данная область кибернетики является предметом активных исследований. Так в Академии наук СССР имеется Научный совет по искусственному интеллекту, являющийся одновременно секцией Научного совета по комплексной проблеме "Кибернетика" при Президиуме Академии. Модельно-кибернетические исследования интенсивно ведутся в Институте кибернетики АН УССР и многих других научных центрах. В этой работе советские ученые деятельно сотрудничают со своими зарубежными коллегами: в 1975 г. в Тбилиси была проведена IV Международная объединенная конференция по искусственному интеллекту, в которой приняла участие большая группа американских кибернетиков; б апреле 1977 г. в Ленинграде состоялось Международное совещание по искусственному интеллекту, на котором специалисты из Советского Союза обсуждали проблемы кибернетического моделирования познавательных процессов совместно со своими коллегами из США и других зарубежных стран. За последние годы в нашей стране был переведен ряд книг и статей, написанных видными американскими кибернетиками, с многими из которых автор полемизирует в предлагаемой читателю монографии.
Книга написана не ученым-кибернетиком, а философом, основательно изучившим соответствующую проблематику и стремящимся осмыслить возможности и границы "искусственного разума". При этом автор уделяет особое внимание не столько возможностям данного направления исследований (о них уже
5
достаточно много написано самими специалистами в области "искусственного интеллекта"), сколько пределам его развития, которые X. Дрейфус и стремится выявить в ходе своего анализа. Появление такого рода работы в западной философско-кибернетической литературе не случайно. Оно вызвано рекламными заявлениями, которые были сделаны представителями данного направления кибернетики в США, а также тем обстоятельством, что некоторые из выдвигавшихся ими прогнозов относительно реализации тех или иных модельно-кибернетических проектов оказались неоправданными. В этой связи X. Дрейфус ставит ряд важных проблем методологического характера, заслуживающих критического анализа и осмысления с позиций диалектико-материалистической методологии. Такой анализ предпринят в статье "Что же могут вычислительные машины? (вместо послесловия) ", написанной доктором философских наук Б.В. Бирюковым, которая помещена в конце книги. Книга снабжена также примечаниями, разъясняющими, уточняющими и исправляющими отдельные ее положения.
Предлагаемая вниманию читателей работа X. Дрейфуса, основанная на богатом фактическом материале и носящая дискуссионный характер, несомненно, привлечет внимание кибернетиков, философов, психологов и специалистов других областей знания.
6
I
С тех пор как древние греки изобрели логику и геометрию, мысль о том, что всякое рассуждение может быть сведено к своего рода вычислению - так что любые дискуссии можно было бы считать улаженными раз и навсегда,- занимала умы большинства представителей точного знания на Западе. Первым, кто высказал эту мысль, был Сократ. Рассказ об "искусственном интеллекте" можно было бы начать с 450 г, до н. э., когда (как повествует Платон) Сократ обратился с вопросом к афинскому гражданину Эвтифрону, который собирался в порыве благочестия выдать властям своего отца, совершившего убийство; "Открой же мне теперь... то, что для тебя, по твоему признанию, совершенно ясно, то есть как надобно отличать благочестие от нечестия.,, что такое сама эта идея, чтобы, смотря на нее и пользуясь ею, как образцом, я мог бы согласное с нею- и в твоих поступках, и в поступках других людей - назвать святым, а несогласное - не святым"*, Сократ просит Эвтифрона открыть ему то, что специалисты по математическому обеспечению вычислительных машин назвали бы "эффективной процедурой", набором "сообщаемых нам время от времени правил, которые точно регламентируют наше поведение"**.
Платон придал этой потребности в моральной уверенности эпистемологический характер. Согласно Платону, всякое знание должно быть представлено в виде точных определений, которыми может пользоваться всякий. Если человек не может представить свое умение в виде такого рода точных правил, то есть если он не в состоянии обратить свои знания о том, как нечто делается, в знание о том, что делать, значит, он располагает не знанием, а верой, уверенностью. Согласно Платону, повара, например, руководствующиеся в своем деле вкусом и интуицией, и поэты, работа
* Платон. Соч., т. 1, Эвтифрон 5 D, 6 Е, СПб., 1863, с. 362, 365. (Звездочками отмечены подстрочные примечания автора; цифрами -примечания к русскому переводу, помещенные в конце книги. - Ред.)
** М. Минский. Вычисления и автоматы1- М., 1971,с, 135. Разумеется, Минский имеет в виду вычислительные процессы, а не действия морального характера.
7
которых зависит от вдохновения, вообще не обладают знанием: то, что они делают, не связано с пониманием и не может быть понято. Таким образом, все, что не может быть сформулировано в виде четких правил - все сферы человеческой мысли, требующие мастерства, интуиции или чувства традиции,- следует расценивать как своего рода бессмысленную одержимость.
Однако Платона еще нельзя считать кибернетиком в полном смысле слова (хотя, согласно Н. Винеру, он был первым, кто употребил этот термин2), поскольку его интересовали главным образом семантические, а не синтаксические критерии. Платон исходил из предположения, что человек понимает значение понятий, составляющих правила. В "Государстве"* Платон говорит, что понимание как таковое (то есть подразделяющаяся на части и подчиняющаяся правилам линия познания)3 зависит от разума, который предполагает диалектический анализ и в конечном счете интуитивные представления о значении основных понятий, используемых в процессе понимания. Таким образом, Платон признает, что его правила не могут быть полностью формализованы. Точно так же современный специалист по вычислительным машинам М. Минский, пытаясь реконструировать представления Платона об эффективной процедуре4, замечает: "Эта попытка дать определение вызывает критику, потому что интерпретация предусмотренных правил не должна зависеть от некоторого субъекта или посредника"**.
Аристотель, расходившийся с Платоном в этом вопросе, как и во многих других, касающихся приложения теории к практике, с удовлетворением отмечает, что для применения платоновских правил необходимо обращение к интуиции. По его мнению, совсем не просто найти формулу, с помощью которой можно было бы определить, как далеко может зайти человек и до какой степени он может заблуждаться, прежде чем в наших глазах он станет виновным5. Точно так же трудно дать определение и в случае любого объекта восприятия; такого рода вопросы о степени виновности неразрывно связаны с обстоятельствами, сопутствующими рассматриваемому конкретному случаю, где единственным нашим критерием служит восприятие***.
Для того чтобы осуществить идею Платона,требуется только одно: исключить какое бы то ни было обращение к интуиции и оценкам, носящим характер мнений. Подобно тому как Г. Галилей пришел к своему открытию чисто формального описания движения физических тел, исключив из рассмотрения все второ-
* См.: Платон. Соч. т. 3. ч. 1,M., 1971, с 89-454. **
** См.: М. Минский. Цит. соч. с. 135.
*** См.: Аристотель. Этика (к Никомаху) . В кн.: Этика Аристотеля, СПб., 1908.
8
степенные факторы и телеологические соображения, новый Галилей в науке о человеческом поведении мог бы добиться успеха, сведя все семантические соображения (обращение к значениям) к методам синтаксических (формальных) преобразований.
Убеждение в возможности такого рода тотальной формализации познания вскоре стало доминирующим в западной мысли. Теперь оно уже выражала основной моральный и интеллектуальный императив, а успехи физических наук подтверждали (как это казалось философам XVI в., а сегодня - таким мыслителям, как Минский) возможность реализации этого императива. Впервые синтаксическая концепция мышления как процесса вычисления была в явной форме сформулирована Т. Гоббсом: "Когда человек рассуждает, он лишь образует в уме итоговую сумму путем сложения частей... ибо рассуждение,., есть не что иное, как подсчитывание"*.
Оставалось только установить первичные элементы - словесные "кванты"6, которыми мог бы оперировать этот чисто синтаксический "калькулятор"- Лейбниц - изобретатель двоичной системы счисления - посвятил свою жизнь разработке необходимого для этого однозначного формального языка. Он полагал, что ему удалось найти универсальную и точную систему обозначений, некоторую алгебру, символический язык, "универсальную характеристику"7, с помощью которой каждому объекту можно приписать определяющее его "характеристическое число". Используя этот прием, всякое понятие можно представить в виде небольшого количества исходных и неопределяемых идей; все знание же может получить выражение и быть объединено в единой дедуктивной системе. На основе этих характеристических чисел-характеристик и правил их комбинирования может быть разрешен любой спор и решена любая проблема. "И если кто-нибудь усомнился бы в том, что я выдвигаю, я ответил бы ему: "Давайте вычислим, сударь!" - и мы, взяв перо и чернила, быстро вышли бы из затруднительного положения"**.
Подобно современному специалисту по математическому обеспечению ЭВМ, сообщающему о некоторой программе, которую он еще только собирается составить, Лейбниц заявляет:
"Так как в силу удивительной связи, в которой находятся все вещи, чрезвычайно трудно выделить изолированные характеристические числа, изображающие небольшое число отдельных вещей, п придумал остроумный искусственный прием, с помощью которого удастся предварительно выра-
* Гоббс. Избран, произв., т.2, М., 1964, с. 75, 76, G. W. Lеibniz. Fragments гиг Logik, Akademie-Verlag. Berlin, 1960,S.91ff8.
9
зить (darlegen) и зафиксировать определенные соотношения, после чего их уже можно подтвердить далее арифметическим вычислением"*.
И Лейбниц не скрывает огромной важности этой почти завершенной программы:
"...после того как для большинства понятий будут установлены характеристические числа, человеческий род приобретет как бы новый орган, который расширит творческие возможности духа в гораздо большей мере, чем это делают оптические инструменты по отношению к остроте зрения, и который в той же мере превзойдет микроскопы и телескопы, в какой разум превосходит зрение"**.
Обладая этим новым мощным инструментом, искусство, способы формализации которого безуспешно искал Платон, можно поднять до уровня теории, В одной из своих "финансовых заявок" (где он объясняет, каким образом можно было бы свести все мышление к манипулированию числами, если бы для этого имелось достаточно средств и времени) Лейбниц замечает:
",,.наиболее важные наблюдения и тонкости в разного рода занятиях и профессиях до сих пор не описаны. Это подтверждается на опыте, когда, пытаясь что-либо произвести, мы переходим от теории к практике. Разумеется, мы имеем возможность самым детальным образом описать результаты этой практики, ибо практика есть, по сути, не что иное, как более сложная и подробная теория"***.
Если Лейбниц только обещает, то Дж. Буль - математик и логик XIX в.- предпринимает шаги для реализации этой программы. Подобно Гоббсу, Буль считает, что рассуждение есть вычисление; его цель -"исследовать основные законы тех операций разума, посредством которых осуществляется рассуждение, выразить их на символическом языке некоторого исчисления"****.
Булева алгебра - это бинарная алгебра для представления элементарных логических функций. Если а и b- переменные, точка представляет союз "и", знак плюс - союз "или", а 1 и 0 представляют соответственно "истину" и "ложь", то правила логических переходов могут быть представлены в следующем алгебраическом виде9:
а+ а = а, а + 0 = а, а + 1 = 1,
а* а = а, а * 0 = 0, а +*1 = а.
Теперь западный человек был готов к началу вычисления.
Почти немедленно - с появлением изобретений Ч.Бэббеджа (1835)- практика стала догонять теорию10. Бэббедж задумал
* G.W. Leibniz; Selections. Ph. W i e n e r led.). New York, Siribner, 1951, p. 15,
** Ibid., p. 23.
*** Ibid.,p. 48 (курсив мой. -Х.Д.).
**** G.Boole, Collected Logical Works. Vol. II. The Laws of Thought (1854). Lasaller Illinois, 1952, p. 1.
10
проект "аналитической машины", как он ее назвал, которая - хотя она так и не была построена11 -должна была функционировать в точности так же, как и современная цифровая вычислительная машина: в ней использовались перфокарты, сочетание арифметических и логических операций, а логические решения, принимавшиеся в ходе вычислительного процесса, находились в зависимости от результатов предшествующих вычислений .
Существенная особенность машины Бэббеджа заключалась в том, что она была цифровой. Существует два основных типа вычислительных машин: аналоговые и цифровые. Аналоговые машины не вычисляют в строгом смысле слова- их функционирование заключается в измерении физических величин. Используя такие физические величины, как электрическое напряжение, длительность, угол поворота диска и т,д., пропорциональные исследуемой величине, они физически комбинируют упомянутые величины и измеряют получающийся результат. Типичный пример аналоговой вычислительной машины - логарифмическая линейка. В цифровой вычислительной машине, как это следует из используемого в ее названии слова "цифровая" - по-английски digit, что по-латыни означает "палец", - все величины представлены дискретными состояниями, например состояниями реле ("включено - выключено") телефонного диска, занимающего любую из десяти позиций, и т. д. Такая машина для получения результата считает в буквальном смысле слова.
Таким образом, в то время как аналоговые вычислительные машины оперируют непрерывными величинами, все цифровые вычислительные машины являются машинами с дискретными состояниями, или машинами дискретного действия. Говоря словами А.Тьюринга, получившего известность благодаря данному им определению природы цифровой вычислительной машины12, работа машины с дискретными состояниями
"складывается из совершающихся последовательно одна за другой резких смен их состояния- Состояния, о которых идет речь, достаточно отличны друг от друга, для того чтобы можно было пренебречь возможностью принять по ошибке одно из них за другое. Строго говоря, таких машин не существует. В действительности всякое движение непрерывно. Однако имеется много видов машин, которые удобно считать машинами с дискретными состояниями. Например, если рассматривать выключатели осветительной сети, то удобно считать, отвлекаясь от действительного положения деп, что каждый выключатель может быть либо включен, либо выключен. То, что выключатель фактически имеет также и промежуточные состояния, несущественно для наших целей, и мы можем об этом забыть"*.
Идеи Бэббеджа опередили технологию его времени, ибо в то время еще не существовало быстрого и эффективного способа
* А. Тьюринг. Может ли машина мыслить? М., 1960, с. 28.
11
представления цифр и манипулирования с ними. Для реализации дискретных состояний Бэббеджу пришлось использовать неуклюжие механические средства, такие, например, как зубчатое колесо. Необходимым технологическим решением оказались электрические переключательные схемы. Когда в 1944 г. Х.Айкен построил первую работающую цифровую вычислительную маши-ну, она представляла собой электромеханическое устройство, в которое входило около 3000 телефонных реле. Однако подобные машины работали еще медленно; и лишь следующее поколение вычислительных машин, в котором использовались электронные лампы, знаменовало собой появление современной ЭВМ, пригодной для любых вычислений.
Но что значит "для любых вычислений"? Цифровая вычислительная машина оперирует абстрактными символами, которые могут означать все что угодно, и логическими операциями, которые могут связывать все что угодно; поэтому любая цифровая вычислительная машина (в отличие от аналоговой) универсальна. Во-первых, говоря словами Тьюринга, она может моделировать любую другую цифровую вычислительную машину.
"Именно зто особое свойство цифровых вычислительных мэшин - то, что они могут имитировать любую машину с дискретными состояниями,- и имеют в виду, когда говорят, что цифровые вычислительные машины являются универсальными машинами. Из того, что имеются машины, обладающие свойством универсальности, вытекает важное следствие: чтобы выполнять различные вычислительные процедуры, нам вовсе не нужно создавать все новые и новые разнообразные машины (если отвлечься от растущих требований к быстрое вычислений). Все вычисления могут быть выполнена с помощью одной-единственной цифровой вычислительной машины, если снабжать ее надлежащей программой для каждого случая. В дальнейшем мы увидим в качестве следствия из этого результата, что все цифровые вычислительные машины в каком-то смысле эквивалентны друг другу"*.
Во-вторых (для философа это крайне важно), любой процесс, в случае если его можно формализовать таким образом, чтобы он представлял собой последовательность правил выполнения некоторых действий над дискретными элементами, может быть, по крайней мере в принципе, воспроизведен на такой машине. Следовательно, даже аналоговая вычислительная машина может быть промоделирована на машине цифровой, при условии что отношение между состояниями входа аналоговой машины и состояниями ее выхода будет описано точной математической функцией**.
* Там же, с, 31.
** В гл. 5 нам представится случай разобраться в том, как этот принцип создает у исследователей, работающих в области моделирования мыслительных процессов человека, глубокую, однако ни на чем не основанную уверенность в правильности избранного ими пути*
12
Однако эти машины так и остались бы просто арифмометрами-"переростками", если бы в них не нашли свое воплощение идеи Платона, рафинированные двумя тысячелетиями развития метафизики. Наконец появилась машина, оперирующая "квантами" данных по синтаксическим правилам. Более того, эти правила встроены в схемы самой машины. После того как в машину закладывается программа, отпадает всякая необходимость в интерпретации: никакого обращения к человеческой интуиции, никаких суждений, основанных на мнениях. Именно к этому стремились Т. Гоббс и Г.Лейбниц; недаром М. Хайдеггер справедливо назвал кибернетику кульминацией философской традиции*.
Таким образом, пока практичные люди вроде Дж. Эккерта и Дж. Мошли проектировали в Пенсильванском университете первую электронную цифровую вычислительную машину, теоретики, такие, как А. Тьюринг, пытаясь понять, какова сущность и возможности машин такого типа, оказались вовлеченными в круг вопросов, который до той поры находился в ведении философов; какова природа рассуждения как такового?
В 1950 г. Тьюринг написал программную статью "Вычислительные машины и интеллект", в которой подчеркнул, что «наш интерес к "мыслящим машинам" возник благодаря машине особого рода, обычно называемой "электронной вычислительной машиной" или "цифровой вычислительной машиной"»**. Затем он поставил вопрос: "Могут ли (такие.- Х.Д.) машины мыслить?"
Для получения ответа на него Тьюринг предложил тест, который назвал игрой в имитацию. Мы читаем:
"Эта новая форма проблемы может быть описана с помощью игры, которую мы назовем "игрой в имитацию". В этой игре участвуют три человека; мужчина (А), женщина (B) и кто-нибудь задающий вопросы (С), которым может быть лицо любого пола. Задающий вопросы отделен от двух других участников игры стенами комнаты, в которой он находится. Цель игры для задающего вопросы состоит в том, чтобы определить, кто из двух других участников игры является мужчиной (А), а кто -женщиной (В) - Он знает их под обозначениями X и У и в конце игры говорит либо: "X есть А и У есть В", либо: "X есть В, и У есть А". Ему разрешается задавать вопросы такого, например, рода:
С: "Попрошу X сообщить мне длину его (или ее) волос".
Допустим теперь, что в действительности X есть А. В таком случае А и должен давать ответ. Для А цель игры состоит в том, чтобы побудить С прийти к неверному заключению. Поэтому его ответ может быть, например, таким:
* М. Неidеgger. La fin de la philosophie et la tache de la pensee,-ln: Kierkegaard vivant, Paris, 1966, p. 178-17913: "В нашу эпоху философия пришла к своему завершению. Она нашла свое место в научном взгляде на мир.,. Фундаментальной особенностью научного детерминизма является его кибернетичность",
** А.Тьюринг. Цит, соч., с. 22-23.
13
"Мои волосы коротко острижены, а самые длинные пряди имеют около девяти дюймов в длину".
Чтобы задающий вопросы не мог определить по голосу, кто из двух других участников игры мужчина, а кто - женщина, ответы на вопросы следовало бы давать в письменном виде или, еще лучше, печатать на машинке. Идеальным случаем было бы телеграфное сообщение между комнатами, где находятся участники игры. Если же этого сделать нельзя, то ответы и вопросы может передавать какой-нибудь посредник. Цель игры для третьего игрока - женщины (В) - состоит в том, чтобы помочь задающему вопросы. Для нее, вероятно, лучшая стратегия - давать правдивые ответы. Она также может делать такие замечания, как: "Женщина - я, не слушайте его!" - но этим она ничего не достигнет, так как мужчина тоже может делать подобные замечания.
Поставим теперь вопрос: "Что произойдет, если в этой игре вместо А будет участвовать машина?" Будет ли в этом случае задающий вопросы ошибаться столь же часто, как и в игре, где участниками являются только люди? Эти вопросы и заменят наш первоначальный вопрос: "Могут ли машины мыслить?"*
Этот тест получил известность как тест Тьюринга. Вероятно, философу простое сходство в поведении машины и поведении человека покажется недостаточным основанием для признания за машиной свойства разумности**, но в качестве цели работы для тех, кто действительно пытается построить думающую машину, а также в качестве критерия, которым можно было бы пользоваться при критической оценке этих попыток, тест Тьюринга подходил как нельзя лучше.
Конечно, ни одна из существовавших тогда машин не могла быть немедленно использована в качестве партнера в игре Тьюринга. Цифровые вычислительные машины, несмотря на их быстродействие, точность и универсальность, все еще оставались ничем иным, как устройствами для переработки символов произвольного вида. Дело, однако, явно склонялось в пользу лейбницевской позиции. Пришло время для создания соответствующего символизма и детальных предписаний, с помощью которых правила ведения рассуждений можно было бы включить в программу для вычислительной машины. Осознав эту задачу, Тьюринг и предложил критерий проверки эффективности такой программы. Однако его статья заканчивается лишь очень общими соображениями по поводу имеющихся перспектив:
"Мы можем надеяться, что машины в конце концов будут успешно соперничать с людьми во всех чисто интеллектуальных областях. Но какие из этих областей наиболее пригодны для того, чтобы начать именно с них? Решение даже этого вопроса наталкивается на затруднении. Многие считают, что начать лучше всего с какой-нибудь очень абстрактной деятельности, например с игры в шахматы. Другие предлагают снабдить машину хорошими органами чувств, а затем научить ее понимать и говорить по-англий-
* Там же, с. 19-20,
** См., например, критические статьи К. Гундерсома и М.Скрайвена в кн.: A. R. Anderson. Minds and Machines. N.Y., Prlntice-Hah, 1964.
14
ски. В этом случае машину можно будет обучать, как ребенка: указывать на предметы и называть их и т. д. В чем состоит правильный ответ на этот вопрос, я не знаю, но думаю, что следует испытать оба подхода"*
Методов нахождения правил, существование которых предполагали мыслители от Платона до Тьюринга - методов превращения любой практической деятельности, будь то игра в шахматы или обучение языку, в набор указаний-команд, который Лейбниц называл теорией,- еще не было. Но немедленно, как будто по подсказке Тьюринга, начались работы по программированию игры в шахматы и машинной обработке информации, записанной на естественном языке. В том же году, когда была опубликована статья Тьюринга, появилась статья создателя теории информации К. Шеннона о машинах, играющих в шахматы, в которой обсуждались возможные подходы к программированию игры в шахматы на цифровой вычислительной машине.
"Исследование одного направления развития игры на 40 кодов вперед настолько же плохо, как и исследование вариантов только на два хода. Подходящим компромиссом было бы исследование только важнейших возможных вариантов, таких, как форсированные варианты взятия фигур и основные угрозы, и продолжение их исследования настолько далеко, чтобы проверить каждый такой вариант до полной ясности. Вполне возможно установить некоторые грубые критерии для выбора важнейших вариантов, конечно, не так эффективно, как это делает шахматист, но достаточно для того, чтобы ощутимо уменьшить число вариантов и, следовательно, позволить рассматривать достаточно глубоко выбранные варианты"**.
К. Шеннон не составил шахматной программы, но он выразил уверенность в том, что "по описанной выше программе машина будет играть довольно сильно и по скорости сравнимо с человеком"***.
В 1955 г. А. Ньюэлл произвел серьезный обзор проблем, возникающих при программировании игры в шахматы, включив в него собственные соображения по поводу того, как к этим проблемам можно было бы подойти. Он писал: "Эти (предлагаемые им.- Х.Д.) механизмы настолько сложны, что невозможно сказать заранее, будут ли они работать"****. Однако уже в следующем году мы стали свидетелями потрясающего успеха. Группа исследователей из Лос-Аламоса составила программу, которая позволила машине играть в шахматы на уменьшенной
* А. Тьюринг. Цит. соч., с. 57.
** К. Ш е н н о н. Машина для игры в шахматы.- В кн.: К.Шеннон. Работы по теории информации и кибернетике1. М-, 1963, с. 187. ***Там же, с. 188.
**** А. Newell. The Chess Machine.- In: The Modeling of Mind, К. М. Say-re and FJ. Crosson (eds.). South Bend, tnd., Notre Dame University Press, 1963, p. 89.
15
доске - хотя и слабо, но с полным соблюдением шахматных правил. Анализируя эту работу, А.Ньюэлл, Дж.Шоу и Г.Саймон писали: "машина с очень несложной программой способна по крайней мере вступить на шахматное поприще: она может обыграть начинающего игрока"*- К 1957 г. А. Бернштейн уже располагал программой для IBM-7G4, сыгравшей две "сносные любительские партии"**.
Тем временем А.Эттингер работал над реализацией второго из предложенных Тьюрингом подходов. Уже в 1952 г, он реализовал на машине программу, моделирующую простой условный рефлекс-способность усиления или ослаблении определенной реакции в зависимости от положительного или отрицательного подкрепления. Затем А.Эттингер занялся проблемой автоматического перевода и составил программу для машинной реализации русско-английского словаря. Казалось, что дальнейшие исследования в этом направлении приведут к созданию такой машины, которую можно научить устанавливать связи между словами и объектами.
Однако ни тот, ни другой подход не привели ни к чему, хотя бы отдаленно напоминающему общую теорию разумного поведения. Отсутствовали правила, в соответствии с которыми любой вид интеллектуальной деятельности можно было бы представить в виде набора инструкций (команд, указаний). В это время Г.Саймон и А.Ньюэлл, анализируя процесс решения студентами логических задач, обратили внимание на то, что их испытуемые зачастую пользуются такими правилами или "прямолинейными" приемами, которые, не будучи универсально применимыми, во многих случаях приводят к успеху, хотя случается и так, что они не позволяют решить задачу. Примером такого чисто эмпирического приема может служить следующее правило: всегда старайся заменить длинное выражение более коротким. А.Ньюэлл и Г.Саймон решили попытаться разработать модель такого практического интеллекта. Получающиеся при этом программы были названы "эвристическими" этим подчеркивалось их отличие от так называемых алгоритмических программ, которые хотя и гарантируют решение соответствующих задач (используя метод исчерпывающего поиска), однако слишком громоздки для практической реализации.
Понятие практически применимого правила дало возможность расширить поле деятельности исследователей, занятых поисками путей программирования на вычислительных машинах таких
* А. Ньюэлл, Дж. Шоу, Г.Саймон. Программа для игры в шахматы и проблема сложности. -- В кн.: Вычислительные машины и мышление, под ред. Э.Фейгенбаума и Дж. Фепьдмана^. М., 1967, с.45.
** Тамже, с. 45.
16
форм поведения, которые имеют место при решении задач общего характера. Волнение, вызванное появлением этой новой идеи, в некоторой степени отразилось на первом параграфе ставшей классической статьи А.Ньюэлла, Дж.Шоу и Г.Саймона «Эмпирические исследования машины "Логик-теоретик"; пример изучения эвристики»:
"Эта работа касается изучения процесса решения задач и является частью программы исследования сложных систем обработки информации. Мы разработали схему дни нахождения доказательства теорем в элементарной символической логике. Составив по этой схеме программу для вычислительной машины, мы с ее помощью получили эмпирические данные, касающиеся процесса решения задач в элементарной логике- Мы назвали эту программу «машина Логик-теоретик» (ЛТ). Она была разработана для того, чтобы изучить возможность решения таких трудных задач, как доказательство математических теорем, выявление научных законов в совокупности опытных данных, игра в шахматы или понимание смысла английской прозы.
Цель настоящего исследования -разобраться в тех сложных процессах ("эвристиках"), которые участвуют в решении задач. Поэтому мы не интересуемся методами, обеспечивающими решения задач, но требующими очень большого объема вычислений, а стремимся понять, каким образом, например, математик в состоянии доказать теорему, даже если он вначале не знает, как ему это сделать, и сможет ли он вообще ее доказать" .
Однако вскоре А.Ньюэлл и Г.Саймон осознали, что и этот подход не может считаться достаточно общим. В следующем, 1957 г. они поставили перед собой задачу выделить используемые в "Логике-теоретике" эвристики и применить их к другим задачам того же рода. В результате возникла программа, получмвшая название "Общий решатель задач"-по-английски "General Problem Solving (сокращенное название - GPS). Мотивы, побудившие ее авторов заняться "Общим решателем задач", и направленность всей работы в своем первом серьезном отчете об этом начинании Ньюэлл, Шоу и Саймон объясняют следующим образом:
"Данная статья... является частью работы, посвященной изучению чрезвычайно сложных процессов, протекающих при разумном, адаптивном и творческом поведении .,
Решению задач может способствовать использование информации самого различного рода; информация может подсказать порядок, в котором следует проверять возможные решения; послужить основанием для того, чтобы исключить из рассмотрения целый класс решений, считавшихся ранее допустимыми; она может оказаться простым тестом для различения правдоподобных и маловероятных вариантов и т. д. Всякая информации такого рода есть эвристика, то есть то, что способствует открытию. Эвристики в редких случаях могут служить безошибочным руководством... Они часто "срабатывают", но их результаты варьируют от
А. Ньюэлл, Дж. Шоу, Г Саймон. Эмпирические исследования машины "Логик-теоретик"; пример изучения эвристики. - В кн.: Вычислительные машины и мышление, 113.
17
задачи к задаче, и успешность их применения нельзя гарантировать"*.
Для того чтобы передать смысл тех общих эвристик, которые Ньюэлл и Саймон используют в своей программе, они приводят пример повседневного разумного поведении:
"Я хочу отправить своего сына в ясли. Что мешает достичь соответствия между тем, что есть, и тем, к чему я стремлюсь? Расстояние. Что может устранить это несоответствие? Использование автомашины. Но мой автомобиль не работает. Что нужно, чтобы он заработал? Новый аккумулятор. А где его достать? В авторемонтной мастерской. Итак, мне нужно обратиться в авторемонтную мастерскую. Но в мастерской не знают о том, что мне нужен аккумулятор. В чем затруднение? В связи. Как установить связь? Для этого существует телефон... И так далее.
Такого рода анализ - классификация объектов с точки зрения функций, которые они выполняют, и переход от поставленных целей к необходимым для их выполнения функциям и средствам их реализации и обратно - составляет основу системы эвристик GPS.
Точнее, такая эвристическая система анализа в терминах "средств и целей" предполагает следующее:
1.Если дан объект, отличный от цели - желаемого объекта,- то следует стремиться к тому, чтобы установить различия между наличным объектом и целью.
2.Операторы воздействуют на одни признаки операндов10, оставляя другие неизменными. Следовательно, операторы можно охарактеризовать, указав на изменений, которые они производят; применяя соответствующие операторы к имеющимся объектам, можно устранять различия между ними и целевыми объектами.
3. Одни различия поддаются воздействию операторов с большим трудом, чем другие. Поэтому следует стремиться к элиминации "трудных" различий, пусть даже ценой введений новых различий, но меньшей трудности. Этот процесс можно продолжать до тех пор, пока не будет достигнут прогресс в элиминации более "трудных" различий"**.
Когда выяснилось, что цифровые машины могут решать задачи такого, например, рода, как задача о людоедах и миссионерах (каким образом переправить через реку трех людоедов и трех миссионеров, и при этом так, чтобы ни один миссионер не был съеден?) 17, возникло ощущение, что наконец-то мечта философов нашла необходимые для своей реализации технические средства и что в универсальную быстродействующую ЭВМ удалось ввести правила, превращающие рассуждение в вычисление, Г.Саймон и А.Ньюэлл почувствовали важность момента и торжественно провозгласили наступление эры разумных машин:
"Мы начинаем понимать, как использовать ЭВМ для решения задач, по отношению к которым мы не располагаем регулярно применимыми и эффективными алгоритмами. И теперь, по крайней мере в некоторой ограниченной области, мы умеем не только программировать
* A. Newell, J. C.Shaw and H. A. Simоn. Report on a General Problem-Solving Program, -In: Proc. int. Conf. on Information Processing, Paris, UNESCO, 1960, p. 257. ** Ibid., p. 259.
18
ЭВМ таким образом, чтобы она успешно выполняла действия, ведущие к решению задачи, но и закладывать в нее способность научения этому.
Короче говоря, теперь в нашем распоряжении имеются элементы теории эвристического (в отличие от алгоритмического) решения задач. Мы можем использовать эту теорию как для того, чтобы понять, как организованы эвристические процессы у человека, так и для того, чтобы моделировать эти процессы на цифровой машине. Интуицию, инсайт и обучение нельзя более считать исключительной прерогативой человека; ими располагает любая достаточно крупная быстродействующая ЭВМ, запрограммированная соответствующим образом"*.
Эта область исследований, в которой цифровые вычислительные машины используются для моделирования разумного поведения, вскоре получила название "искусственного интеллекта". Не следует, однако, думать, что она действительно соответствует этому названию. Вне всякого сомнения, искусственная нервная система, в достаточной степени близкая к человеческой, которая связана с органами чувств и реализована в некотором теле, конечно, будет обладать разумом. Однако термин "искусственный" не означает, что исследователи искусственного интеллекта пытаются построить искусственного человека. На современном уровне развития физики, химии и нейрофизиологии это недостижимо. Саймон и другие пионеры "искусственного интеллекта" предлагают создать нечто более ограниченное: эвристическую программу, дающую возможность цифровой машине, перерабатывающей информацию, проявлять разумность.
Термин "интеллект" тоже может привести к недоразумениям. Проектируя робота, никто не ожидает от него, что он будет воспроизводить любое поведение, которое считается разумным для человека. Роботу не придется, например, выбирать себе хорошую жену или переходить улицу на оживленном перекрестке. Он должен конкурировать с человеком только в более объективных и отвлеченных сферах человеческого поведения - с тем чтобы быть в состоянии одержать верх в игре Тьюринга.
Но именно эта ограниченность цели, поставленной исследователями, работающими в области "искусственного интеллекта", придает такое большое значение их работе. Эти "последние метафизики" делают ставку только на способность человека к формализации своего поведения; в случае выигрыша они смогут, пренебрегая мозгом и телом, постичь самую суть рационального.
Вычислительные машины уже привели к научно-технической революции, сравнимой по значению с промышленной революцией. Если Саймон прав, говоря о неизбежности "искусственного интеллекта", то ЭВМ подводят нас к грани свершения еще более значительной, концептуальной революции - к изменению наших
* H.A.Simon, A.Newell Heuristic Problem Solving: The Next Advance in Operations Research.- Operations Research, vol. 6, 1958, January-February, p. 6.
19
представлений о человеке. Важность этой революции ощущается всеми, однако мы настолько близки к соответствующим событиям, что порой бывает трудно четко представить себе их смысл. Во всяком случае, ясно следующее. Аристотель назвал человека разумным животным, и с тех пор считалось, что разум неразрывно связан с сущностью человека. Если мы находимся на пороге создания искусственного интеллекта, то в ближайшее время мы станем свидетелями триумфа весьма ограниченного представления о разуме. Действительно, если разум может быть "заложен" в вычислительную машину, то это подтвердит такое понимание природы человека, к которому в течение двух тысяч лет на ощупь шли западные мыслители и которое лишь сегодня получило средства для выражения и реализации. Воплощение этой интуитивной идеи коренным образом изменит наши представления о самих себе. Если же создание "искусственного интеллекта" окажется невозможным, то нам придется найти ту границу, которая отделяет человеческий разум от искусственного, что также радикально изменит наше понимание самих себя. Таким образом, наступил тот момент, когда мы должны либо окончательно признать, что имеющее за собой глубочайшую традицию интуитивное прозрение оказалось верным, либо отказаться от тех представлений, которые в течение двух тысячелетий считались проникновением в природу человека.
Хотя сейчас, по-видимому, еще не наступило время решения этого вопроса, мы все-таки обязаны попытаться определить масштабы и пределы такого рода разума, который полностью вступил в свои права с тех пор, как "аналитическая машина" была доведена до совершенства. Мы должны попытаться понять, в какой степени осуществим "искусственный интеллект", а если возможности машинного моделирования разумного поведения ограниченны, мы должны найти эти границы, определить, где они проходят. Все, что мы узнаем о границах разумного в применении к вычислительным машинам, будет добавлением к нашему представлению о характере и объеме человеческого интеллекта. Для этого нам понадобится ни больше ни меньше, как критика "искусственного разума".
II
Потребность в критике "искусственного разума" есть лишь частное проявление общей потребности в критическом отношении к наукам о поведении. Н.Хомский однажды заметил, что в этих науках "всегда наблюдалась вполне естественная, но достойная сожаления тенденция к "экстраполяции": полученный в результате тщательной экспериментальной работы и точной обработки
20
данных минимум знаний экстраполировался на вопросы, которые имеют гораздо более широкое значение и наполнены огромным социальным содержанием". Его вывод, относящийся к 1968 г., состоит е следующем:
«[ Специалисты ] несут на себе ответственность за тог чтобы были ясны действительные пределы их знания и тех результатов, которые получены ими на сегодняшний день, а внимательный анализ этих пределов продемонстрирует, по моему мнению, что практически в каждой области социальных и поведенческих наук достигнутые на сегодня результаты не оправдывают такую "экстраполяцию"»*.
На первый взгляд кажется, будто искусственный интеллект является счастливым исключением из этого прискорбного правила. Каждый день мы читаем о том, как цифровые вычислительные машины играют в шахматы, переводят тексты, распознают образы и скоро вообще смогут делать всю нашу работу. В самом деле, это начинает походить на детскую забаву. В буквальном см: юле этого слова! В издании Североамериканского газетного объединения, вышедшем в декабре 1968 г., была помещена статья, озаглавленная "Компьютер для детишек", в которой говорится:
"Западногерманское издательство "Космос".-, предложило новую идею подарка... Это самый настоящий (хотя и маленький) компьютер стоимостью не более 20 долларов. Работает на батарейках и внешне напоминает портативную пишущую машинку. Однако, как и в любую большую ЭВМ, в это устройство можно вводить программы для перевода с иностранных языков, диагностики заболеваний и даже для получений прогноза погоды".
Из статьи под названием "Будьте знакомы: Шейки -первый электронный человек", появившейся 20 ноября 1970 г, в журнале "Life", ошарашенный читатель узнает о существовании ЭВМ, «"смонтированной из пяти главных электронных систем, в значительной степени соответствующих основным способностям человека: восприятию, разуму, речи, памяти [и] "самосознанию"» . Судя по статье, эта ЭВМ "видит", "понимает", "учится" и вообще "доказала, что машины могут мыслить". Цитируются также высказывания некоторых известных ученых - специалистов по вычислительным машинам, которые предсказывают, что по прошествии трех-пятнадцати лет "будет создана машина, общий интеллект которой будет на уровне среднего человека, а еще через несколько месяцев он окажется на уровне гения,..".
Хотя до создания совершенного робота пройдет еще несколько лет, все, кто интересуется, как будет выглядеть мир на рубеже двух столетий, могут посмотреть фильм "2001 год: космическая Одиссея", в котором показан робот по имени ХЭЛ, невозмутимый, рассудительный, знающий и умеющий чуть ли не все на свете. И этот фильм нельзя считать просто плодом научной фантазии: "Космическая Одиссея" снималась после тщательной
* Н. Хомский. Язык и мышление19 М., 1972, с. 10-11.
21
документальной проверки. Постановщик фильма С.Кубрик консультировался с самыми видными специалистами по вычислительной математике и технике, стремясь избежать ошибок и не включать в фильм совсем уж маловероятные вещи. Сам Тьюринг в 1950 г, выразил уверенность в том, что "к концу нашего века употребление слов и мнения, разделяемые большинством образованных людей, изменятся настолько, что можно будет говорить о мыслящих машинах, не боясь, что тебя поймут неправильно"*. Технический консультант этого фильма профессор Массачусетского технологического института М.Минский, работавший в своей лаборатории над одним из первых прототипов ХЭЛа, заверил Кубрика, что если Тьюринг и ошибается, то только в сторону излишнего пессимизма.
Тот факт, что С. Кубрик правильно истолковал слова М. Минского, очевиден из редакционной статьи последнего в "Science Journal", которая весьма напоминает сценарий к фильму "2001 год":
"Сначала машины выполняли самые простые действия. Но скоро их поведение станет фантастически изящным. Если раньше глаза ЭВМ могли нащупать лишь дырочки на перфокартах, то сейчас они распознают контуры на ровном фоне. Скоро они станут соперничать с человеком в анализе окружающей его обстановки. Было время, когда машины просто склады-вали столбики цифр. Сейчас они могут участвовать в играх (типа шахмат), понимают простой разговор, учитывают множество факторов при принятии решений. Что будет дальше?
Сегодня машины решают задачи главным образом по тем правилам, которые мы в них закладываем. Однако недалеко то время, когда мы, возможно, научимся настраивать их таким образом, чтобы они могли работать над очень важной проблемой совершенствовании собственной способности решения задач. При этом может случиться так, что после перехода через некоторый порог способности машины будут расти все быстрее, словно по спирали удаляясь от исходной точки, так что создание надежного их "регулятора" окажется совсем нелегким делом"**.
Складывается впечатление, что нет предела размаху и великолепию надлежащим образом запрограммированной ЭЦВМ, Неудивительно поэтому, что среди тех, кто занимается философией науки, встречается мнение, согласно которому машина в состоянии делать все, что в состоянии делать человек (это сопровождается попыткой представить себе, чем такая точка зрения чревата для философского осмысления разума); в то же время некоторые моралисты и теологи не на жизнь, а на смерть защищают такие в высшей степени утонченные формы поведения, как моральный выбор, любовь и творчество, считая их находящимися вне досягаемости машины. Однако мыслители как того, так и другого
* А. Тьюринг. Цит. соч., с. 32.
** M.Minsky. Machines Are More Than They Seem.-Science Journal, 1968, October, p. 3,
22
толка оставляют без внимания вопрос, который должен был бы предшествовать всем остальным, а именно: действительно ли машины могут достичь хотя бы элементов творчества, играя в шахматы, разрешая простые проблемные ситуации, читая простые предложения и распознавай образы? По-видимому, это связано с тем, что под влиянием прессы и таких исследователей, работающих в области "искусственного интеллекта", как М. Минский, у них сложилось впечатление, что простые задачи - и даже некоторые из очень трудных - уже решены или находятся на пороге решения. Поэтому прежде всего займемся проверкой этих заверений.
Уместно начать с предсказания, сделанного Г.Саймоном в 1957 г., когда, казалось, его "Общий решатель задач" открывал эру искусственного интеллекта:
"В мои намерения не входит удивить или поразить вас. То, что я хочу сказать, можно выразить в нескольких словах: в настоящее время в мире существуют машины, которые мыслят, учатся и проявляют способность к творчеству. Более того, эти их способности будут быстро расти вплоть до того момента в обозримом уже будущем, когда сфера их деятельности охватит круг всех вопросов, над которыми когда-либо размышлял человеческий разум".
Далее Саймон продолжает:
"1. Не пройдет и десяти лет, как цифровая вычислительная машина станет чемпионом мира по шахматам, если не будут введены правила, не допускающие ее к соревнованиям.
2. Не пройдет и 10 лет, как вычислительная машина найдет и докажет важную и до сих пор неизвестную математическую теорему.
3. Не пройдет и десяти лет, как большинство психологических теорий примет форму программ для вычислительных машин или качественных утверждений о тех или иных характеристиках машинных программ”*
К сожалению, десятая годовщина этого исторического выступления прошла незамеченной, а исследователям "искусственного интеллекта" ни на одной из своих многочисленных конференций (как международных, так и внутри США) так и не удалось выкроить время между докладами, посвященными их успешной работе, чтобы сопоставить эти предсказания с реальными результатами. До настоящего момента прошло уже четырнадцать лет20, и нас по-прежнему предупреждают, что, быть может, вскоре нам будет трудно справляться с нашими роботами. Вне всякого сомнения, давно пора сопоставить эти своеобразные пророчества с действительностью.
По прошествии пяти лет после предсказаний Саймона в опубликованных работах появились намеки на то, что первое из
* H.A.Simon, A.Nеwell, Heuristic Problem Solving: The Next Advance »n Operations Research. Operations Research, voL 6, 1958, p. 6 .
23
его предвидений уже наполовину осуществилось, а в отношении второго наблюдается значительный прогресс. Что касается этого последнего, то есть предсказания о машинных открытиях теорем, то его стали считать "исполнившимся" после того, как У.Р.Эш-би - один из ведущих авторитетов в этой области - в произведенном им обзоре коллективного труда "Вычислительные машины и мышление", вышедшего под редакцией Э.Фейгенбаума и Дж. Фельдмана, поделился своими восторгами по поводу математических способностей надлежащим образом запрограммированной ЭВМ: "Программа Гелернтера для доказательства теорем нашла новое доказательство теоремы pons asinorum, которое не требует никаких построений". Это доказательство, продолжает доктор Эшби, "в течение 2000 лет оставалось незамеченным величайшими математиками.,, будь оно найдено, это доказательство получило бы самую высокую оценку"*.
Машинная теорема выглядит внушительно, и наивный читатель невольно начинает разделять энтузиазм У.Эшби. Однако небольшое углубление в вопрос показывает, что pons asinorum, или «ослиный мост», есть не что иное, как элементарная теорема, доказываемая в геометрии Евклида21; согласно этой теореме, в равнобедренном треугольнике углы, лежащие против равных сторон, равны. Более того, первое упоминание об этом будто бы новом доказательстве, "открытом" машиной, приписывается Пап-пу Александрийскому, жившему в конце III - начале IV в. н.э.** Несоответствие между ликованием Эшби, древностью теоремы и тривиальностью ее доказательства просто поразительно. Нет, мы еще весьма далеки от "важной математической теоремы", которая должна была быть найдена к 1967 году!
История с игрой в шахматы более запутана, она могла бы послужить моделью для изучения процесса возникновения интеллектуального смога, В 1958 г,, через год после предсказания Саймона, появилась тщательно разработанная шахматная программа Ньюэлла, Шоу и Саймона. Как указывалось в их классической работе, названной "Программа для игры в шахматы и проблема сложности", эта программа была "еще полностью не отлажена", так что о ее поведении имелся "лишь небольшой фактический - материал"***; тем не менее авторы предполагают, что принципов, заложенных ими в программу, достаточно для разыгрывания дебютов. Это была последняя подробная публикация, посвященная данной программе. Однако в том же году Ньюэлл, Шоу и Саймон
* W,R. Ashby. Review of E.A. Feigenbaum and J.Feldman feds,). Computers and Thought. The Journal of Nervous and Mental Diseases, vol. 140, No 6, June 1965, p. 468^70.
** D.E. Smith. History of Mathematics. Boston, Ginn, 1925, vol. II, p. 284,
*** A, Newell, J, Shaw and H.Simon, Chess-Playing Program and the Problem of Company, p.60.
24
провозгласили: "Мы составили программу, играющую в шахматы"*. На основе этого заявления Саймон пересмотрел сделанное им ранее предсказание:
" В одной из наших публикаций мы предсказывали, что не пройдет и десяти лет, как ЭЦВМ откроет и докажет важную математическую теорему. Исходя из опыта нашей работы с эвристиками в логике и шахматах, мы готовь/ добавить к этому дополнительное предсказание: понадобится всего лишь незначительное развитие возможностей уже существующей программы для того, чтобы достичь необходимого для такого рода моделирования увеличения ее мощности в решении задач" **.
Доверчивость читателей и энтузиазм Саймона были столь велики, что одних только заверений Ньюэлла, Шоу и Саймона, касающихся их все еще не отлаженной программы, оказалось достаточно, чтобы шахматная машина была запущена на орбиту научной мифологии. В 1959 г. Н.Винер, развивая утверждение Саймона об умении программы "хорошо разыгрывать дебюты", сообщил Институту философии Нью-Йоркского университета, что "машины, играющие в шахматы, типа тех, которые существуют уже сегодня, будут отвечать на ходы мастера ходами, которые рекомендуются для таких позиций в учебниках; на этом уровне машина сможет продолжать игру вплоть до определенного момента в миттельшпиле"***. На том же симпозиуме М. Скрайвен перешел от расплывчатых заверений типа "машины теперь играют в шахматы" к более сильному утверждению о том, что "способности машины уже позволяют ей вести хорошую игру"****.
На самом же деле в нескольких зарегистрированных играх программа Ньюэлла, Шоу и Саймона играла слабо, хотя и по правилам, а в официальной схватке в октябре 1960 г. она проиграла на 35 ходу десятилетнему начинающему шахматисту. Этот факт, однако, не имеет отношения к делу.
В то время как программа Ньюэлла, Шоу и Саймона терпела поражение в плохо сыгранных ею пяти-шести партиях, а порожденная теми же авторами мифическая программа успешно противостояла шахматным мастерам вплоть до миттельшпиля, сами авторы хранили молчание. Когда же года три спустя они вновь обрели дар речи, то сообщили не о трудностях и разочарованиях, а скорее наоборот: как бы продолжая прерванное изложение мифа, в статье, опубликованной в журнале "Behavioral Science", Саймон
* A. Newell, J.Shaw and H. Siтоn, - The Processes of Creative Thinking, The RAND Corporation, P-1320, September 16, 1958, p, 6,
** ibld., p. 78.
*** N.Wiener. The Brain and the Mashine (Summary).-In: Dimensions e, 1961, p. 110,
**** Scriven, The Complete Robot: A Prolegomena to Androidologyp.122
25
объявил о создании программы, которая гложет играть "высокотворческие" шахматные эндшпили, включающие "комбинации, не уступающие по сложности любым из тех, которые вошли в историю шахмат"*. Тот факт, что программа ограничивается только рассмотрением эндшпилей, в которых можно непрерывно шаховать противника, что значительно сокращает перебор вариантов, лишь упоминается, но не подчеркивается. Искусственно создается впечатление, что такие же простые эвристики достаточны для ведения игры на уровне мастера даже в миттельшпиле**. Таким образом, у читателя создается впечатление, что та часть предсказаний, которая касается шахмат, почти реализована. С такими достижениями можно хоть сегодня претендовать на титул чемпиона мира по шахматам. И действительно, один из специалистов по вычислительным машинам назвал прогноз Г.Саймона, рассчитанный на десять лет, "консервативным"***. Другой ученый - Ф. Грюнбергер из корпорации RAND - намекнул, что титула чемпиона мира недостаточно и что следует стремиться к созданию "программы, которая играла бы лучше любого шахматиста"****. Эта новая волна тумана наводит на мысль о загадочном звере из французской легенды, который мог дышать только дымом, им же извергаемым.
А действительность, прихрамывая, плетется позади этих впечатляющих заверений. Замешательство, вызванное моей попыткой привлечь внимание исследователей в области "искусственного интеллекта" к несоответствию между их энтузиазмом и по-
* Н. A. Simоn and P.A. Simon. Trail and Error Search in Solving Difficult Problems: Evidence from The Game of Chess,- Behavioral Science vol. 7 1962, October, p. 429.
** Например, в резюме к работе Г. Саймона и П. Саймона 1см. предыдущее примечание) даже не упоминается, что речь идет о форсированных матах; авторы просто заключают, что "в этой работе делается попытка до какой-то степени рассеять мифический туман, окутывающий игру в шахматы; мы показали, что успешное решение задач основывается не на чудесном даре воспоминания и озарения, а на некоторой эвристической "программе", обладающей высоким уровнем избирательности" (р. 425) , А в заключении к самой статье делается ничем не оправданное обобщение: "Из приведенных данных следует совершенно определенный вывод: мастерам шахматной игры удается находить те или иные комбинации не потому, что они быстрее думают или лучше запоминают, чем другие люди, а потому, что их программы реализуют мощные эвристики выбора" (р. 429). Если к приведенным данным отнестись честно, то из них в лучшем случае следует, что этот вывод применим лишь к некоторым конкретным ситуациям эндшпиля,
*** См,: Р, Армер, О возможностях кибернетических систем22. - В кн.: М. Таубе. Вычислительные машины и здравый смысл- Миф о думающих машинах, 1964, с. 181.
**** F.Grunberger, Benchmarks in Artificial Intelligence.-The RAND Corporation, P-2586, 1962, June, p. 6.
26
лученными результатами, в конце концов привело к появлению более или менее компетентной программы. "Мак Хэк" - программа, написанная Р. Гринблатом, -действительно победила автора этих строк*, типичного шахматиста-любителя, и приняла участие в нескольких турнирах, где выиграла некоторое количество партий. Этот скромный успех возродил былые надежды и претензии. С.Пейперт, второе по рангу лицо в реализации программы разработки роботов в Массачусетсом технологическом институте, выступил в защиту предсказания Саймона, заявив, что "в качестве формулировки ближайших целей, которые исследователи в данной области считают достижимыми, оно вполне разумно"**. А на первой странице октябрьского выпуска "Science Journal" за 1968 г. Д.Мичи, возглавляющий исследования в области "искусственного интеллекта" в Англии, писал: "Сегодня машины могут играть в шахматы на уровне чемпионов"***. Однако, как сказал при обсуждении первых шахматных про* грамм шахматный мастер А. де Гроот, "машины все еще очень слабо играют в шахматы, и у меня мало надежд на существенное улучшение их игры в будущем". Другой шахматист, Э.Херст, обсуждая на страницах журнала "Psychology Today" шахматную программу, составленную в Массачусетском технологическом институте, добавляет, что, хотя "замечание де Гроота было сделано в 1964 г., результаты, полученные "Мак Хэк" на последнем турнире, не изменили бы его мнения"****. То же можно сказать и о положении дел в настоящее время. Программа Грин-блата постепенно усовершенствовалась; однако она достигла, по-
* Ликование, охватившее "машинные" круги в связи с сообщением об этом новом успехе, который якобы подтверждает обоснованность предшествующих заявлений о возможностях ЭВМ, нашло отзвук в книге А. Тофлера "Грядущий шок" (А. Тоffler, Future Schock, New York, Random House, 1971, p. 187). По словам этого автора, я будто бы утверждал, что ни одна вычислительная машина никогда не сможет играть в шахматы даже на любительском уровне. Если взять эту цитату в контексте, то станет ясно, что автор искажает смысл сказанного мною. Мое утверждение сводилось просто к объективной констатации уровня развития программирования шахмат на тот момент (1965 г.), когда оно было выдвинуто: "В соответствии с оценкой, даваемой Ньюэллом, Шоу и Саймоном программам Лос-Аламосской группы исследователей, группы исследовательского центра фирмы IBM и их собственной, "все три программы играют приблизительно на одном уровне (посредственном), затрачивая при этом приблизительно одно и то же машинное время". Однако ни одна шахматная программа не в состоянии вести игру даже на уровне любителя, в то время как до мирового чемпионата по шахматам осталось только два года".
** S. Рарert\ 9th RAND Symposium, 1966, November 7, p, 116.
*** D. Miсhie. Machines that Play and PJan.-"Science Journal/' vol. 4-. 1968, No. 10, October, p. 83.
**** E. Hearst. Psychology Across the Chessboard.-Psychology Today 1967, June, p. 32.
27
видимому, некоторой точки "насыщения". За прошедшие два года она проиграла все партии в турнирах, в которых принимала участие, и больше о ней не упоминалось. Вскоре мы увидим, что, учитывая ограниченные возможности вычислительных машин, именно этого и следовало ожидать.
К чести Р. Гринблата следует сказать, что, даже когда его "Мак Хэк" находилась в зените славы, он избегал предсказаний; что же касается прогнозов Саймона и вопроса об участии ЭВМ в борьбе за шахматную корону, то заметим только, что десять лет давно прошли, а вычислительная машина в лучшем случае в состоянии претендовать в шахматах на категорию С23, то есть любительскую категорию*.
Надеюсь, что этот беглый обзор положения дел в данной области и его сопоставление с обоими предсказаниями Салопа прояснили существующую ситуацию. Очень важно с самого начала отдавать себе отчет в том, что, несмотря на всякого рода предсказания, сообщении в печати, демонстрации кинофильмов и т.д., "искусственный интеллект" все еще остается обещанием, а не свершившимся фактом. Только при этом условии мы можем начать исследование реального положения дел и будущих перспектив, касающихся "искусственного интеллекта” на достаточно изначальном уровне.
В области "искусственного интеллекта" существует множество делений и подразделений, но самые важные работы можно сгруппировать в следующие четыре направления: программирование игр, автоматический перевод, решение задач24 ц распознавание образов. Какого уровня достигли исследователи в программировании игр, мы уже видели. Ниже мы займемся более детальным анализом остальных трех направлений. Основной тезис, развиваемый мною в части I, сводится к тому, что в области "искусственного интеллекта" ход событий следует одной и той же схеме: первоначальный впечатляющий успех быстро сменяется неожиданными трудностями. Эта схема присутствует во всех четырех областях, реализуясь в два этапа, каждый из которых
* Третье предсказание - о том, что большинство психологических теорий примут форму программ для ЭВМ, - действительно до некоторой степени осуществилось, хотя в психологии до сих пор имеется немало "чистых бихевиористов”. Однако действительно важным является не решение тех или иных задач, пусть даже весьма значительных (например, составление программ игры в шахматы на уровне мастера или доказательство нетривиальных теорем), а то, представляет ли реализация некоторого предсказании фактический шаг вперед. Так, неясно, насколько плодотворным а психологии оказывается переход от "поведенческих" моделей к моделям машинным. Этот вопрос достаточно сложен и требует подробного обсуждения (см. гл. 4).
28
длится приблизительно пять лет. С 1957 по 1962 г. (гл. 1) в основном велись работы по моделированию познавательных процессов, заключавшиеся в использовании эвристического программирования для машинного воспроизведения человеческого поведения; при этом предпринимались попытки имитации тех мыслительных переходов, которыми человек фактически пользуется. На втором этапе (гл. 2) центром тяжести стало изучение процессов переработки семантической информации. Здесь термин "искусственный интеллект" приобрел более узкий смысл, чем тот, который я в него вкладывал в предшествующем изложении.
ИИ {я буду использовать такое сокращение для обозначения этого более узкого смысла} представляет собой попытку моделирования разумного поведения человека с помощью таких методов программирования, которые не имеют или почти не имеют сходства с мыслительными процессами человека. Трудности, с которыми мы сталкиваемся при таком подходе, уже начали проявляться. Остальные главы части I касаются вопроса о том, какова основная причина всех этих, казалось бы не связанных между собой, неудач.
Однако все практические трудности и провалы ни в коей мере не приводят в отчаяние самих исследователей: создается впечатление, что их оптимизм растет с каждым новым разочарованием. Поэтому мы вынуждены заняться вопросом о том, какие предпосылки заложены в столь стойком к постоянным неудачам оптимизме, В части II предпринимается попытка выявить четыре допущения, четыре глубоко укоренившихся предрассудка, которые мешают видеть всю серьезность создавшегося безвыходного положения и прояснить путаницу понятий, порождаемую этими предрассудками.
Эти предрассудки столь глубоко укоренились в нашем сознании, что кажется, будто единственной альтернативой дли" них может быть обскурантистское отрицание всякой возможности точной науки о человеческом поведении. В части III мы попытаемся отвести это опасение (в той мере, в какой его можно вообще отвести), предлагая некоторую альтернативу упомянутым традиционным допущениям; последняя основывается на идеях, выдвинутых теми мыслителями XX столетия, в работах которых имплицитно содержится критика "искусственного интеллекта", - идеях, которые до сих пор не рассматривались под таким углом зрения.
На этой основе в заключение становится возможным выявление основных характеристик "искусственного разума" и указание его возможностей и его ограничений. Это в свою очередь создает базу для разграничения различных форм разумного поведения и оценки, в какой степени каждая из них может быть предметом программирования - как с практической точки зре-
29
ния, так и в принципе.
В некотором ограниченном круге вопросов ИИ может - и, по всей вероятности, будет - иметь практическую ценность, несмотря на те ограничения, которые, как я попытаюсь показать в дальнейшем, являются фундаментальными. (Я ограничиваюсь рассмотрением только ИИ, ибо все еще неясно, может пи то наивное моделирование человеческого процесса познания - в том виде, в каком оно имеет место сегодня, - иметь вообще какую бы то ни было ценность, кроме, может быть, той, что оно служит нагляднейшим доказательством того факта, что человек, демонстрирующий разумное поведение, обрабатывает информацию не так, как это делает эвристически запрограммированная ЭЦВМ.) Устройства специального назначения могут заменять человека при выполнении некоторых задач, например в исследованиях других планет; при этом они не обязательно должны действовать так же, как человек, и проявлять свойственную человеку гибкость. Неверно говорить, что исследования в этой области не имеют смысла, хотя следует заметить, что определенное философское осмысление вопроса и здесь способствовало бы выработке более трезвого взгляда на то, чего можно и чего нельзя ожидать от такого рода устройств.
30
нового слова, иногда достаточно просто указать пальцем на обозначаемый этим словом предмет. Блаженный Августин в своей "Исповеди" и А.Тьюринг в своей статье о "машинном интеллекте" полагают, что именно таким способом мы обучаем детей языку. Однако Л.Витгенштейн замечает, что просто указав пальцем, например, на стол и сказав слово "коричневый", мы тем самым еще не дадим знать ребенку, что именно имеется в виду:. цвет, размер или форма стола, тип объекта или его собственное имя. Если же ребенок уже владеет языком, то ему можно сказать, что имеется в виду именно цвет. Ну, а с чего начать, если ребенок еще совсем не понимает языка? Витгенштейн считает, что для этого ребенок должен быть погружен в своего рода "жизненную среду", в которой он разделяет по крайней мере некоторые из целей и интересов своего учителя; при этом каждодневная деятельность ребенка помогает ему устанавливать соответствия между употребляемыми словами и тем, что они обозначают. Коль скоро это так, то чему же можно научить машину? Именно этот вопрос ставится в одной из немногих серьезных и критически окрашенных работ, вышедших из-под пера исследователей "искусственного интеллекта", . Э.Сэмюэль, составивший известную шашечную программу, утверждает, что машина не может считаться разумной, поскольку она в состоянии делать только то, что ей предписано программой. М.Минский не принимает этого положения, ибо, по его мнению, достижения наших машин могут оказаться неожиданными для нас самих. Сэмюэль, как никто иной, знает об этом, поскольку его собственная шашечная программа его обыграла. Скорее всего, он имеет в виду другое: только запрограммировав машину соответствующим образом, можно вложить в нее способность выигрывать; программирование же в корне отличается от процесса обучения ребенка игре в шашки. Доводы Сэмюэля отклоняются М. Скрайвеном, который утверждает, что новые стратегии «"закладываются" программистом в вычислительную машину... точно в том же метафорическом смысле, в каком мы говорим о "закладывании" в ребенка необходимые для его дальнейшей жизни знаний»*. Однако Сэмюэлю, устоявшему против давления со стороны своих коллег, не следует поддаваться наступлению философов. Информация действительно "закладывается" в машину, но способом, совершенно отличным от процесса обучения детей. Мы только что видели, что этому процессу не дано и, как мы увидим в гл. 6, не может быть дано точное определение. Наши попытки объяснить обучаемому какое-либо выражение всегда происходят в определенном контексте, помогающем усвоить или уточнить его смысл. Обучение в * М. Scriven. Primary Philosophy. New York, McGraw-Hill 1966 p. 186. 56 отличие от запоминания и заучивания с необходимостью предполагает своего рода оценивание. Вот что пишет по этому поводу Л. Витгенштейн: "Может ли кто-нибудь быть учителем в этом процессе? Конечно. Время от времени он дает ученику нужный намек... Именно в этом заключаются преподавание и обучение в данном случае... На этом уровне человек усваивает не какой-то технический навык, а учится верному взгляду на вещи. Правила здесь также существуют, но они не образуют системы и применять их надлежащим образом могут только опытные люди; как это не похоже на правила, по которым производятся вычисления!"* Вот эта-то способность улавливать смысл в конкретном контексте и характеризует настоящее обучение; как только дети начинают с этим справляться, они постоянно удивляют нас, преподнося нам сюрприз за сюрпризом. Из всего сказанного относительно существенной роли контекста и неоднозначности в процессе использования естественного языка становится понятным, почему работа в области машинного перевода приостановилась на этапе создания машинного словаря. Как мы видели, способность научения языку предполагает ту же сложную комбинацию сугубо человеческих форм "процесса переработки информации", которая необходима для его понимания. Вопрос о том, как с помощью научения обойти трудности, с которыми неизбежно сталкивается эта область исследований, остается открытым. Метод проб и ошибок или отделение существенного от несущественного? В моделировании решения задач также встречаются два типа функционирования мышления: один, элементарный и допускающий разложение на составные части, объясняет удачное начало исследований в данной области; другой, более сложный и включающий в себя феномен "инсайта", оказался недоступным для "пошаговых" программ типа программы "Общего решателя задач" Саймона. При решении элементарных задач наиболее эффективен простой перебор всех возможных комбинаций, продолжающийся до тех пор, пока не подвернется нужное решение. Такой поиск с помощью метода проб и ошибок являет собой еще один пример "силового приема" типа сплошного просчитывания в шахматах. Но как и при моделировании игр, возможности * L. Wittgenstein. Philosophical Investigations. Oxford, Eng, D- Black-well, 1953, p. 227. Здесь Л. Витгенштейн имеет в виду приобретение способности судить о проявлениях чувств, однако его утверждение имеет и более общий смысл. 57 машины и здесь вскоре оказываются исчерпанными. При моделировании решения задач необходимо найти какой-то систематический метод сужения зоны поиска, который не позволял бы тратить время на проверку неперспективных альтернатив. Именно на этом этапе в человеческом мышлении начинает действовать механизм "инсайта" - "озарения", интуиции, в то время как математики-программисты впадают в глубокое уныние. Допустим, что задача сформулирована просто, то есть совершенно детерминистским образом, так что нам известна исходная ситуация, мы представляем себе искомое заключительное состояние и располагаем набором простых, специально заданных операторов для перехода от одного состояния к другому (иными словами, пусть мы имеем дело с тем, что Саймон назвал "простой формальной задачей"). Тогда созданный Саймоном "Общий решатель задач", произведя перебор значительного числа возможностей, будет сближать "начало" и "конец" до тех пор, пока задача не окажется решенной. Мы имеем, таким образом, удачный вариант применения анализа в терминах "средств и целей". Но даже в таком простом случае возникает масса трудностей. Если сравнить этапы машинного решения задачи на основе программы GPS, выданные на печать, с записью словесного отчета испытуемого о том, как он решал ту же самую задачу, то мы обнаружим, что ЭВМ совершала шаги (формальный поиск), которым нет соответствия в протоколе эксперимента. Как же объясняет Саймон факт отсутствия в отчете испытуемого этих шагов? С методологической точки зрения весьма сомнительно: "многое, связанное с задачей, не было высказано субъектом в явном виде (или даже не было им осознано)"*. Еще более необоснованным выглядит предположение Саймона о том, что эти невербализованные операции столь же элементарны, как и те, которые нашли явное выражение в протоколе опыта. А между тем некоторые подробности, упомянутые в работе Ньюэлла и Саймона "GPS - программа, моделирующая процесс человеческого мышления", наводят на мысль о том, что эти глубоко упрятанные операции вообще не имеют ничего общего с операциями, производимыми машиной согласно программе GPS. В одном из экспериментов Саймона испытуемым предлагались задачи, относящиеся к формальной логике; при этом испытуемых снабжали перечнем правил преобразования символических выражений; их просили устно комментировать каждый шаг поиска решения. Не будем излагать правил преобразования; для нас существенно другое; в определенном месте протокола субъект говорит, что он применяет правило (А- В D А) и правило * А. Ньюэлл и Г. Саймон. GPS - программа, моделирующая процесс человеческого мышления. - В кн.; Вычислительные машины и мышление, с. 295. 58 (А-ВЭВ) к конъюнкции ( IRVHPt-(RVQ). По этому поводу Ньюэлл и Саймон замечают: " Субъект использовал обе формы правила 8 совместно, по крайней мере если судить по его рассуждениям, GPS же рассматривает каждую форму правила 8 отдельным пунктом. Возможно, что субъект действует так бессознательно и просто выдает два результата одновременно"*. Не менее вероятно, однако, что испытуемый уловил симметричность конъюнкции относительно преобразования, производи-мого данным правилом, и действительно применил сразу обе его формы. Даже сами Ньюэлл и Саймон признают, что было бы предпочтительнее, если бы GPS применила обе формы правила в одном пункте. Только в этом случае их программа могла бы послужить основой для создания психологической теории, описывающей этапы рассуждений испытуемого. Однако они благоразумно воздерживаются от попыток составить программу, которая могла бы определять, в каких случаях следует применять обе формы правила сразу, а в каких - нет. Составление такой программы (что отнюдь не устранило бы описанного выше несоответствия машинного и человеческого подходов) потребовало бы дополнительных сведений о действиях субъекта - сведений, не нашедших отражения в протоколе эксперимента,- и тем самым привело бы к увеличению расхождений между отчетом испытуемого и программой. Таким образом, будучи не в состоянии избежать этих расхождений и не пытаясь даже понять их смысл, Ньюэлл и Саймон просто отмахиваются от них, считая, что имеют здесь дело с "примером параллельно протекающих процессов"**. Однако в другом приводимом Ньюэллом и Саймоном случае расхождений уже нельзя отделаться такой оговоркой. Так, в одном из протоколов мы читаем: "Собственно говоря, мне следовало бы применить правило 6 лишь к левой части уравнения. Итак, надо применить правило 6, но только к левой части". Саймон пишет: "Здесь есть сильное расхождение со схемой действий GPS... И субъект и GPS нашли, что именно правило 6 подходит для изменения знаков. Здесь GPS просто применила правило к текущему выражению, в то время как испытуемый вернулся назад и исправил предшествующее применение. В программе мы не найдем чего-либо, что соответствовало бы этому * Там же, с. 296. ** См. там же, с. 297. Произвольный характер этого объяснения ad hoc ясен из контекста. Более того, отвечая на соответствующий вопрос во время своей Мэллоновской лекции в Массачусетсом технологическом институте s 1968 г., Саймон сказал по этому поводу, что, по его мнению, параллельно протекающие процессы не играют никакой роли в познании и что, насколько он помнит, он никогда этого не утверждал» 59 действию. Наиболее непосредственное объяснение состоит в том, что применение правила 6 в обратном направлении рассматривается субъектом как уничтожение правила 6, примененного ранее"*. И действительно, это объяснение напрашивается прежде всего, однако Ньюэлл и Саймон, по-видимому, не осознают, что этот отход от схемы действий машины, не объяснимый ссылкой на параллельно протекающие процессы, чреват для их теории таким же крушением, которое потерпела теория Птолемея, когда обнаружилось, что действительные траектории планет ей не соответствуют. Все дело в том, что здесь имеет место какая-то иная форма мышления, отличная от простого поиска! Ньюэлл и Саймон понимают суть проблемы, ибо замечают: "Здесь речь идет о механизме (а может быть, и о целом комплексе механизмов), который отсутствует у GPS"**. Но, подобно древним астрономам, они пытаются спасти свою теорию, добавляя к ней пару-другую эпициклов. Они по-прежнему полагают-без достаточных на то оснований, -что в основе подобного механизма лежат просто более изощренные методы поиска и что если дать GPS возможность "постоянно немного оглядываться назад, на свои предыдущие действия"***, то все будет в порядке. Ньюэлл и Саймон не отдают себе отчета в том, что, представляя разумное поведение как результат применения эвристических правил, они вынуждены принять малоправдоподобную точку зрения, согласно которой намерение субъекта провести анализ предшествующей части решения должно быть результатом в высшей степени избирательной процедуры проверки. В противном случае возникнет необходимость на каждом этапе решения проверять все предыдущие шаги, что безнадежно утяжелит программу. С научной точки зрения более продуктивным было бы произвести дальнейший анализ тех пяти случаев расхождений, о которых говорится в статье Ньюэлла и Саймона, с тем чтобы определить, не используется ли в данном случае человеком какая-либо другая форма "информационных процессов". Так, гештальтпсихолог М.Вертгеймер в своей классической работе "Продуктивное мышление" отмечает, что представление о решении задач как о последовательности проб и ошибок исключает из рассмотрения важнейший аспект процесса решения задач, а именно то "схватывание" ее существенной структуры, которое он называет "инсайтом"****. При выполнении этой операции человек отвлекается от поверхности задачи и видит ее основу - то что М.Вертгеймер * Там же, с. 298-299. **Там же, с. 300, *** Там же. **** M.Wertheimer. Productive Thinking, New York, Harper and Bros., 1945, p. 202. 60 называет "глубинной структурой"; именно она дает ему возможность организовать необходимые для отыскания решения шаги. Может показаться, что эта гештальтистская концепция в корне противоречит операционистским воззрениям сторонников "искусственного интеллекта", однако М. Минский, правда в других выражениях, делает следующее признание: "Способность решения трудной задачи зависит от умения либо разделить ее на несколько подзадач меньшей трудности, либо преобразовать ее в менее сложную задачу. Для того чтобы не делать этого наугад, требуется некоторое понимание ситуации. Человек должен уметь логически обосновать или просто догадаться о последствиях той или иной формулировки задачи, с тем чтобы суметь построить более простые модели проблемной ситуации. Эти модели должны иметь достаточно богатую структуру; тогда, по всей вероятности, найденные для них решения удастся расширить до решения исходной задачи"*. Поскольку при решении сложных задач человек, как правило, прибегает к помощи "инсайта" - интуиции - и поскольку то, о чем говорит М.Минский, никогда не было доведено до уровня программы, нет ничего удивительного в том, что в работе Ньюэлла и Саймона такого рода интуитивная перестройка структуры задачи тайком производится самими программистами. В работе "Процесс творческого мышления" Ньюэлл, Шоу и Саймон для объяснения тех характеристик отчета испытуемого, которые не укладываются в рамки простого анализа в терминах "средств и целей", вводят так называемые проектирующие эвристики ("эвристики планирования"). "Мы разработали программу... описывающую метод, с помощью которого некоторые испытуемые решают логические задачи исчисления О. Мура. Чтобы объяснить, в чем состоит введенное нами понятие "планирования", проще всего, пожалуй, описать эту программу. Исходя из чисто практических соображений, все двенадцать операторов, входящих в эту логическую систему, можно разбить на два класса; операторы одного из них мы будем называть "существенными", второго - "несущественными". Будем считать оператор существенным, если его применение к выражению "сильно" изменит вид этого выражения (примером может служить переход от PVP к Р). Несущественные операторы "слабо" меняют выражение (таков, например, переход от PVQиQVP).Kaк мы уже сказали, различие между существенными и несущественными операторами носит чисто прагматический характер. Из двенадцати операторов рассматриваемого исчисления восемь мы отнесли к классу существенных, а четыре - к классу несущественных... Далее, если нам дано некоторое выражение, то мы можем выделить из него только такие характеристики, которые связаны с существенными изменениями. Например, из выражения PVQ мы можем получить выражение (PG), в котором порядок следования символов можно не принимать во внимание. Очевидно, если к полученному выражению применить несу- * М.Мinsky. Descriptive Languages and Problem Solving,- In: Semantic Information Processing, p. 421 61 щественный оператор, то оно не изменится, в то время как применение существенного оператора может привести к его изменению. Теперь мы можем установить некоторое соответствие между исходными выражениями и операторами, с одной стороны, и производными выражениями и существенными операторами - с другой. При этом исходной задаче преобразования выражения а в выражение b будет соответствовать новая задача - задача преобразования выражения b' в выражении b (где а' и b'извлекаются из выражений а и b соответственно). Предположим теперь, что мы решили эту новую задачу и что последовательность выражений, ведущая к решению, есть а', с', d',... b' . Тогда мы можем вернуться к исходной постановке проблемы и заняться решением новых задач - преобразованием выражения а в с, с в d и т. д. Таким образом, решение задачи в пространстве проектирования дает нам некоторый план решения исходной задачи"*. Комментарии, как говорится, излишни. Остается только подчеркнуть, что описание самой программы начинается с параграфа 2. Классификация операторов на существенные и несущественные, то есть та операция, которую Вертгеймер называет "нахождением глубинной структуры" или "инсайтом", выполняется программистами еще до начала самого программирования. Подобная "ловкость рук" прошла незамеченной для Дж. Миллера, Е. Галантера и К. Прибрама, если судить по их книге "Планы и структура поведения" (1960), которая представляет собой попытку создания психологической теории, разработанной под влиянием работ А,Ньюэлла, Дж.Шоу и Г.Саймона. Дж.Миллер и др. для начала приводят слова Дж.Пойа, прекрасно отдающего себе отчет в том, какую важную роль играет интуиция в решении задач; "В своей известной работе "Как решать задачу",.. Пойа различает... [следующие] фазы эвристических процессов. Во-первых, мы должны понять задачу. Мы должны ясно представить то, что дано, в каких условиях это дано и то неизвестное, которое мы ищем. Во-вторых, мы должны составить план, который приведет нас к решению и свяжет данное с неизвестным"**. Затем Миллер, Галантер и Прибрам сводят к минимуму значение первой фазы; попросту говоря, они решают не обращать внимания на этот этап: "Очевидно, что второй из этих этапов самый трудный. Первый этап, который мы уже описали в главе XI, сводится к созданию четкого образа ситуации, необходимого для того, чтобы найти способ решения этой задачи, Это, конечно, необходимо, но, обсуждая четко сформулированные задачи, мы принимаем, что это уже выполнено" **. Тем не менее вся эта психологическая теория решения задач немногого будет стоить, если в машинную модель не удастся * A.Newell, J.Shaw , H.Simоп. The Processes of Creative Think-jng35,~The RAND Corporation, P-132GH 1958, September 16, p. 43-44. ** Дж. Миллер, Е. Галантер и К, Прибрам. Планы и структура поведении 36. М., 1965, с. 197. *** Там же. 62 ввести этот первый этап. Поэтому нет ничего удивительного в том, что где-то страниц через десять, принимая и оправдывая анализ в терминах "средств и целей" Саймона, Миллер и его соавторы с облегчением ссылаются на "метод планирования"* Саймона, по-видимому, имея в виду те самые абзацы, которые мы только что обсуждали: "Вторая общая система эвристической логики, использованная Ньюэллом, Шоу и Саймоном, состоит в пренебрежении рядом деталей задачи. Обычно это упрощает задачу, и эта упрощенная задача может быть решена с помощью знакомого нам плана. План, используемый для решения простых задач, затем применяется как стратегия при решении исходных сложных проблем. Например, при решении задач пропозиционального исчисления машина может игнорировать различия между логическими связями и порядок символов"**. Но, как мы видели, не машина игнорирует эти решения, а сами Ньюэлл, Шоу и Саймон. Говорить в данном случае об эвристиках - значит просто вводить читателя в заблуждение, поскольку никому еще не удавалось сформулировать правила, по которым производится этот предварительный выбор, а также показать, что на этом требующем интуиции этапе человек вообще следует каким бы то ни было правилам. Таким образом, выясняется, что никакой машинноориентированной теории для этого фундаментального первого этапа решения задач, состоящего в разделении существенного и несущественного, не существует. Только исследователи, столь уверенные в собственной правоте, как Миллер и его соавторы, могли оставить без внимания тот факт, что "метод планирования" Саймона с его предварительной обработкой исходного материала не столько приводит к решению проблемы машинного моделирования, сколько ставит ее. Именно способность человека отделять существенное от несущественного в каждой конкретной задаче объясняет наличие расхождений между отчетом испытуемого, решающего задачу, и результатом работы GPS. Мы уже указывали на то, что испытуемый применяет обе формы правила 8 вместе вследствие того, что уже на этой начальной стадии он осознает равноправие обоих членов конъюнкции. Аналогичным образом вследствие того, что он постиг существенную функцию, которая заключена в правиле 6, субъект в состоянии заметить, что повторное применение этого правила просто нейтрализует предыдущее применение. Как замечает М.Вертгеймер: "Этот процесс (структурирования задачи.- Х.Д.) не исчерпывается рассмотрением данных ее частей и их преобразованиями. Он происходит на основе того материала, который по своей структуре адекватен задаче, но выбирается из прошлого опыта"***. * Там же, с. 214. ** Там же, с. 209-210 (курсив мой.- *** М. Wertheimеr. Productive Thinking, p. 195. 63 Поскольку игра есть одна из форм решения задач, вполне возможно, что этот процесс имеет место в шахматах. Как следует из цитаты Э. Херста, это действительно так. "В результате своего исследования де Гроот приходит к выводу, что различия в силе игры в гораздо меньшей степени зависят от способности просчитывания, чем от умения "концептуально видеть задачу"- По всей вероятности, гроссмейстер превосходит мастера в умении выделять наиболее существенные особенности позиции, а не в общем числе ходов, которые он в состоянии рассмотреть. Несколько неожиданным для де Гроота оказался тот факт, что при выборе конкретного хода гроссмейстеры исследуют не больше возникающих при этом вариантов, чем более слабые игроки или мастера (в среднем от двух до четырех начальных ходов на позицию). Нельзя также сказать, что они просматривают эти варианты на большую глубину (обычно максимум на шесть-семь ходов вперед} -Гроссмейстер каким-то образом способен сразу "увидать" суть задачи, в то время как более слабый игрок постигает ее с трудом или вообще не постигает, даже если анализирует столько же вариантов и видит на столько же ходов вперед, что и гроссмейстер"*. Как мы видели, М. Минский уже в 1961 г. ясно осознавал важность этих проблем. Единственное, на что он надеялся,- это на то, что удастся изобрести такую планирующую программу, в которой обычный эвристический поиск будет использоваться на более высоком уровне. "Когда мы настаиваем на применении "рассуждения", мы ни в коей мере не предлагаем отказаться от нашего основного замысла и ввести некую интеллектуальную процедуру. Программа, управляющая поиском, будет не чем иным, как еще одной эвристической программой. Почти наверняка в нее будут входить в основном только объекты и процессы того же типа, что и в программы первого уровня"**. Но такая планирующая программа со своей стороны потребовала бы разделения операторов на существенные и несущественные. Если сам программист не проведет на каком-то этапе такого разделения, то он будет вынужден бесконечно наращивать планирующие программы, так как для каждой из них потребуется программа более высокого уровня, чтобы формализовать соответствующую ей задачу с плохой структурой. Именно здесь, при переходе от простых форм "информационных процессов" к сложным. Минский делает обычный в таких случаях ход - вводит обучение. " Проблема подбора способа дедукции полезных заключений из большого массива высказываний (то есть проблема соотнесения различных методов с различными типами задач) ставит новую задачу поиска. Логическое исследование должно проводиться только по тем данным, которые * Е.Неаrst. Psychology Across the Chessboard,- Psychology Today, 1967, June, p. 32. ** M.Minsky,Descriptive Languages and Problem Solving.- In: Semantic Information Processing, p. 420. 64 вероятнее всего имеют отношение к текущей задаче. Малоправдоподобно, чтобы эта функция отбора была полностью задана с самого начала. Она должна совершенствоваться по мере накопления данных в ходе эксперимента"*. Однако до сих пор никто даже не попытался гипотетически описать, каким образом машина могла бы осуществлять эту операцию отбора или как следует ее запрограммировать, чтобы она могла научиться этому, поскольку иначе никакое обучение на основе прошлого опыта невозможно. Оценивая работы, выполненные после выхода в свет труда "Вычислительные машины и мышление", Э.Фейгенбаум отмечает бросающееся в глаза отсутствие обучающихся программ: "До сих пор в области ИИ значение машинного обучения для решения проблем осознавалось весьма слабо. Единственную, по существу, за много лет заслуживающую упоминания работу представляет известная шашечная программа Сэмюэля и использованная в ней процедура обучения, (Большой интерес в свое время вызвала предложенная Ньюэллом, Шоу и Саймоном система обучения GPS , однако она осталась нереализованной.) Как это ни удивительно, и в наши дни ситуация остается прежней"**. Такая задержка развития удивительна только для тех, кто, подобно Фейгенбауму, не осознает, что способность к различению существенного и несущественного является чисто человеческой формой "процесса переработки информации", необходимой для обучения и решения задач; она не воспроизводится методами машинного поиска, которые эффективны только после того, как такое разделение произведено. Именно эта функция интеллекта преграждает путь дальнейшему прогрессу в области решения задач. Более того, представление, что проблема планирования может быть решена изолированно и что возможно разделение операторов на существенные и несущественные - наподобие готовых блоков, которые остается только рассортировать,- является представлением чисто иллюзорным, возникшим под влиянием искусственных- ad hoc- приемов решения задач и простых случаев (например, относящихся к области логики); легко поддаться искушению и уверовать в то, что те или иные операторы существенны или несущественны сами по себе. Возникает взгляд, что, поскольку операторы таковы, на нашу долю остается лишь установление эвристического правила для их сортировки. Однако обычно (нередко даже в логике) существенность операторов находится в зависимости от контекста прагматического характера, * Ibid., p. 123. ** Э.Фейгенбаум. Искусственный интеллект: темы исследования во втором десятилетии развития. - Кибернетический сборник, Новая серия, вып. 10, М., 1973, с. 18437. 65 Ньюэлл, Шоу и Саймон откровенно признают, что они вынуждены прибегать к предварительной обработке исходного материала, использующей интуицию. В связи с этим у них, казалось бы, нет ни малейшего основания утверждать, что при решении задач человеком тот тип поведения, который не очень ясно называют сообразительностью, интуицией, проникающим в суть дела "озарением", в действительности является результатом рассудочного применения тех или иных эвристик, служащих для сужения пространства поиска решения. Наоборот, их работа с GPS показала, что до тех пор, пока не будет произведена предварительная структуризация задачи, всякий поиск усложнен настолько, что его и поиском-то не назовешь. Шутки ради заметим, что исследования в области моделирования процессов познания сами являют прекрасный пример, так сказать, разумного поведения по программе GPS, когда она предоставлена самой себе. Здесь мы также сталкиваемся с чем-то вроде залатывания дыр и подшивания кусочков с помощью приемов ad hoc - поведением, характерным для человека, завороженного поверхностной структурой задачи; это своего рода карабканье на дерево в надежде добраться до Луны. Может быть, именно потому, что в "моделировании процесса познания" интуиция не в чести, некоторые исследователи в этой области ошибочно приняли поведение GPS за разумное. Списочная организация признаков или осмысленная группировка объектов? Вычислительная машина распознает любой образ только на основе заданного перечня специфических признаков. При этом возникает проблема экспоненциального роста,- проблема, которую человек способен обойти, потому что идет каким-то другим путем. Следовательно, при моделировании распознавания даже простых образов может потребоваться обращение ко всем рассмотренным нами выше основным формам "переработки информации" человеком. И если исследователям в области "искусственного интеллекта" удалось, используя машинные методы, добиться некоторых успехов в простых случаях, то такие сложные образования, как художественные стили или лица людей, обладающие весьма расплывчатыми чертами сходства и различия, по-видимому, требуют для их узнавания своеобразной комбинации процессов, происходящих на периферии сознания, феномена допустимой неоднозначности и "инсайта" - всего того, что недоступно цифровой вычислительной машине. Неудивительно поэтому, что работа по распознаванию образов довольно поздно началась и довольно быстро притормозилась. 66 В гл. 1 мы отметили, что слабая сторона существующих в настоящее время программ по распознаванию образов (за исключением, возможно, программы Л.Юра и Ч.Фосслера, возможности операторов которой - она распознает всего пять букв - еще недостаточно проверены) заключается в том, что они не в состоянии сами вырабатывать операторы выбора. Теперь, однако, мы покажем, что такая постановка вопроса основывается на предпосылках, таящих в себе более глубокие и более сложные проблемы. "Инсайт", Первый признак, указывающий на то, что распознавание образов человеком и ЭЦВМ различается коренным образом, состоит в том, что человек (и животные) - в отличие от машины - справляется с изменениями в ориентации и размерах изображений, его неполнотой, искажениями, зашумленностью фона. В пору возникновения направления "искусственного интеллекта" специалисты, разрабатывавшие программы распознавания, сначала старались нормализовать изображение, а потом проверяли, как оно идентифицируется с образами некоторого множества. Однако человек при распознавании объектов, по-видимому, пренебрегает изменениями их размеров и ориентации; пропусками в изображении фигур и т. п. Хотя некоторые константы восприятия действительно подвергаются определенной нормализации (кажущиеся размеры и яркость варьируют в меньшей степени, чем соответствующие изменения сигнала, достигающего сетчатки глаза), не вызывает сомнения, что мы не нуждаемся в полностью нормализованном и "сглаженном" изображении, поскольку, воспринимая изображение искаженным, неполным, большим или маленьким и т.д., мы можем в то же время узнать его. В программах более позднего времени нормализации изображения нет - в них используются мощные операторы, выделяющие отличительные характеристики образов и в то же время нечувствительные к искажению и шумам. Однако маловероятно, чтобы в процессе распознавания человек применял такого рода искусственные приемы. Как выяснилось, в тех особых случаях, когда человек может выразить словами то, на что он обращает внимание, он пользуется не мощными операторами, которые позволяют справляться с размазанными изображениями и шумом, а скорее набором идеальных характеристик, к которым каждый конкретный распознаваемый объект может только приближаться. Мы узнаем искаженные образы не потому, что они попадают в рамки, определяемые более широким и более искусно заданным набором признаков, а вследствие того, что образы эти обладают теми же простыми свойствами, что и образы неискаженные,- вместе с некоторыми случайными чертами. Аналогичным образом мы не проверяем наличие шума, с тем чтобы потом его отбросить, а 67 просто игнорируем его, считая несущественным*. И здесь мы опять сталкиваемся со способностью человека к различению существенного и несущественного. Периферийное сознание. Для того чтобы определить, с каким из множества уже проанализированных образов предъявляемый объект имеет наибольшее сходство, был предложен способ последовательной проверки наличия у него определенных признаков из некоторого их набора (метод дерева решения). Другой часто встречающийся метод (он реализован в программе О.Сэлфриджа "Пандемониум") состоит в использовании вероятностей присутствия признаков (из заданного их множества) - Оба эти метода с несомненностью предполагают, что человек, подобно механическому распознающему устройству, обязательно классифицирует образы в терминах четко заданного списка признаков. О.Сэлфридж и У.Ниссер не сомневаются в том, что "человек, выделяющий какой-либо образ из совокупности раздражителей, по существу, уже провел классификацию всех возможных входных сигналов"**. В обзоре работ по распознаванию образов И. Хант придерживается того же мнения: "Распознавание образов, так же как и формирование понятий, включает в себя научение правилам классификации"***. Однако в тех случаях, когда образ хоть сколько-нибудь сложен и достаточно сходен с большим числом других образов - в результате чего для его распознавания требуется большое число признаков, -возникает угроза экспоненциального роста. Таким образом, предположение, что всякое распознающее устройство, будь то человек или машина, работает по аналитическому принципу, выделяет отдельные черты объекта, ведет к предположению, что должны существовать определенные критические признаки, которые делают распознавание осуществимым; все дело в том, чтобы их отыскать либо запрограммировать ЭЦВМ так, чтобы она сама их находила. Тем самым нас склоняют к поиску своего рода эвристик восприятия, "мощных" операторов, которых пока еще никому не удалось обнаружить. Как шахматист не в состоянии объяснить программистам, каким образом он * Каковы бы ни были процессы переработки информации, которые осуществляет мозг человека для выделения образов, этому, несомненно, способствует организация рецепторов. Но даже если бы удалось так сконструировать рецептивный вход вычислительной машины, чтобы она осуществляла перцептивное выделение объекта (отделение фигуры от фона), то такого рода селективные рецепторы потребовали бы введения стадии аналоговой обработки информации, чего исследователи в области "искусственного интеллекта" стараются избегать. ** О. G.Selfridge, U. Nеisser. Pattern Recognition by Machine.-ln: Computers and Thought, p, 238. *** E.Hunt. Computer Simulation: Artificial Intelligence Studies and Their Relevance to Psychology .-In: Annyal Review of Psychology, P.R.Farns-worth (ed.),vol. 19, Palo Alto (Calif.), 1968, p. 145. 68 находит кратчайший путь к решению, так и, как отмечают Сэлфридж и Ниссер, в случае распознавания образов "очень часто принцип классификации остается неизвестным даже (самому распознающему.-ХД)". Тем не менее Сэлфридж и Ниссер, подобно Ньюэллу и Саймону, исходят из предпосылки, что испытуемый подсознательно производит поиск в лабиринте -е данном случае просматривает список признаков. При этом они вынуждены заключить, что подобный принцип классификации "слишком сложен для точного описания"*. Однако поиск, основанный на таком списке, чрезвычайно затруднителен, по крайней мере для человека - последний для принятия того или иного решения в состоянии исследовать последовательно (или параллельно) далеко не все релевантные признаки; многие признаки, определяющие исход распознавания, вообще никогда не рассматриваются в явном виде, но оказывают свое влияние, оставаясь на периферии сознания. Если в шахматах мы начинаем с общего "чувства ситуации" и только на заключительном этапе анализа переходим к просчитыванию, то в процессе восприятия мы вообще никогда не обращаемся к каким бы то ни было четким признакам. Как правило, мы распознаем сходство предмета с другими предметами, не отдавая себе отчета в том, что он является примером предметов данного типа или элементом некоторого класса предметов, задаваемого набором специфических признаков. Анализируя различия между перцептивным и понятийным сознанием, А.Гурвич пишет: " Воспринимаемые предметы являются нам вместе с задающими их родовыми характеристиками... Но - и это крайне важно - воспринимать объект некоторого рода - совсем не значит понимать, что этот предмет является представителем или частным случаем предметов того или иного типа"**, Иногда, разумеется, можно выделить определяющие характеристики в явном виде; ((Первый шаг в становлении понятийного сознания состоит е акте расчленения предмета, воспринимаемого в его типичности. Образующие предмет родовые признаки, которые до этого имманентно в нем присутствовали и были слиты с предметом, теперь отделяются, освобождаются от него. Выраженные в явной форме, эти признаки могут восприниматься сами по себе..- В результате такого расчленения родовые признаки превращаются в объект генерализации. В этой своей новой сущности они противостоят тому предмету восприятия, от которого только что отделились и который теперь превратился в пример или частный случай,,. [Таким образом, неявные ориентиры.- Х.Д. ] могут быть выделены и превращены * O.G.Selfridge, U.Neisser. Pattern Recognition by Machine.- In: Computers and Thought, p. 238. ** A.Gurwitsch. On the Conceptual Consciousness.-In: The Modeling of Mind, p, 203. 69 в объект [специфический признак, который мы осознаем. - Х.Д.] в то время как ранее они только способствовали образованию другого объекта [образа. - Х.Д. ], находясь, так сказать, на "немых ролях"*. Это движение от перцептивного сознания к понятийному (говоря словами Паскаля, от перцептивного склада ума к математическому) не обязательно означает шаг вперед, А. Гельб и К.Голдштейн исследовали нескольких человек, страдающих афазией, которые утратили способность перцептивного распознавания. Для такого больного всякое распознавание превращается в задачу классификации. Подобно цифровой вычислительной машине, больному приходится обращаться к тестовым наборам признаков и поисковым процедурам. Некоторые из больных афазией могут узнать геометрическую фигуру, например треугольник, только проверяя соответствующие признаки, то есть подсчитав число ее сторон, после чего делается вывод: "Треугольник имеет три стороны. Следовательно, это треугольник"**. Такое понятийное, концептуальное распознавание требует много времени и очень неуклюже: жертвы подобного нарушения деятельности мозга абсолютно не приспособлены к повседневной жизни. Очевидно, в распознавании образов переход от неявного перцептивного разбиения на группы к точной понятийной классификации- даже на завершающей стадии, как это имеет место в шахматах,- обычно невыгоден. Тот факт, что для того, чтобы распознать некоторый образ, нам не нужно концептуализировать признаки или четко формулировать свойства, присущие нескольким экземплярам данного объекта, указывает на отличие человеческих способов распознавания от машинных, при которых распознавание происходит только на явном концептуальном уровне, в терминах принадлежности предметов к определенным классам. Уменьшение неоднозначности, основанное на учете контекста. В рассмотренных до сих пор случаях признаки, определяющие принадлежность элемента некоторому классу, могли всегда быть представлены, по крайней мере в принципе, в явной форме, хотя, как правило, для практического использования в распознавании они слишком многочисленны, В некоторых случаях, однако, формализация признаков невозможна даже в принципе. Для того чтобы разобраться в этом вопросе, мы должны сначала убедиться в несостоятельности мнения, разделяемого в равной степени как "традиционными" философами, так и исследователями в области "искусственного интеллекта", согласно которому распознавание образов всегда можно представить себе как своего рода класси- * Ibid., р 204-205. ** М. Мerleau-Ponty. Phenomenology of Perception, London, R, and K.Paul, 1962, p. 128 ff. 70 фикацию. В этом слишком поспешном заключении объединяются без разбора три разных типа узнавания, ни один из которых не обладает теми характеристиками, которых требуют от него философы и цифровые вычислительные машины. Во-первых, существует тип узнавания или распознавания, который А. Гурвич называет "родоотносящим". С помощью узнавания такого типа мы можем сказать, например, что данный предмет есть карандаш. Гурвич подчеркивает, что этот тип распознавания, хотя он и представлен в нечеткой форме, поддается уточнению в терминах списка признаков. Таким образом его, по-видимому, можно привести к виду, допускающему программирование. При этом, однако, Гурвич упускает из виду, что при распознавании такого типа отбор существенных признаков и использование некоторых из них в качестве основы узнавания определяются назначением, целью. Например, когда-то для человека, который хотел писать чернилами, было важно то, что гусиное перо, если его заточить, может быть пишущим инструментом. Однако после того, как появились металлические ручки, за ними сохранилось наименование перьев (но не карандашей), по-видимому в связи с тем, что для тех, кто стал ими пользоваться, решающим оказалось их свойство оставлять на бумаге знаки, которые нельзя стереть. Из этого можно было бы сделать вывод, что свойство оставлять нестираемые знаки является определяющим критерием для того, чтобы считать предмет пером, в то время как форма пера есть, говоря словами Л.Витгенштейна, только "симптом" - "явление, относительно которого опыт показал нам, что оно тем или иным образом сочетается с данным явлением, выступающим в качестве определяющего критерия". Можно попытаться даже встроить это различие между симптомом и критерием в нашу программу. Однако, по мнению Л.Витгенштейна, это различие характеризуется тем, что не является данным раз и навсегда, а изменяется вместе с изменением наших целей и знаний. "Если вас спросят, какое явление есть определяющий критерий, а какое - симптом, то практически вы почти всегда окажетесь не в состоянии ответить на этот вопрос - разве что возьмете ответ "с потолка". В одном случае, возможно, будет удобно при определении некоторого слова использовать в качестве критерия одно явление, однако в другом случае выяснится, что это же слово можно определить с помощью другого явления, которое в первом случае оказывается только симптомом. Врачи пользуются наименованиями заболеваний, не задумываясь над тем, какие явления следует считать определяющими критериями, а какие - симптомами, что совсем не обязательно ведет к прискорбному отсутствию ясности. * L.Wittgenstein. The Blue and Brown Books, p. 25 71 И в самом деле, это один из путей, на котором наши понятия становятся критериями, открытыми для применения при распознавании образов человеком, приобретая гибкость, которой так не хватает вычислительной машине, использующей фиксированный набор существенных признаков. Второй тип узнавания - это распознавание сходства. В узнавании этого типа, как и в феномене "ограничения"* при определении значений слов и предложений, решающую роль играет контекст. Благодаря контексту мы начинаем замечать те признаки сходства, которые впоследствии можем узнать в изолированном виде - как в случае фигур, допускающих двоякое толкование, таких, как утка-кролик Л.Витгенштейна; будучи окружена изображениями уток, она похожа на утку, а в окружении кроликов напоминает кролика. При других обстоятельствах контекст помогает нам обратить внимание на некоторые аспекты образа, как в знаменитом эксперименте В.И. Пудовкина38. "Однажды Пудовкин сделал крупным планом снимок Мозжухина, выражение лица которого было абсолютно бесстрастным, а затем смонтировал три отрывка, в каждом из которых кадры с Мозжухиным шли после следующих кадров: в первом случае - тарелки с супом, во втором - молодой женщины, лежащей в гробу, и, наконец, ребенка, играющего с плюшевым мишкой. И что же получилось? Создалось полное впечатление, что в каждом из этих кадров Мозжухин смотрит соответственно на тарелку, на женщину и на ребенка: на суп он глядит задумчиво, на женщину - с выражением горя, а на ребенка - улыбаясь. Зрители были поражены разнообразием его выразительных средств, хотя so всех трех случаях был использован один и тот же кадр, о котором если и можно что-то сказать, так только то, что он на редкость невыразителен" Вот поразительный пример того, как контекст определяет различие в восприятии определенного выражения лица в ситуации, когда никакие характеристики лица, воспроизводимого на экране, не могут объяснить этого различия. Нам могут возразить, что то выразительное, по мнению зрителей, лицо, которое они видели на экране, имело определенные черты - печальные глаза, например, или счастливую улыбку, которые и помогли зрителю узнать то или иное выражение. Но выражение части лица, например глаз человека, может зависеть от всего лица таким образом, что, если закрыть остальную часть лица, оно станет совсем иным. * Разумеется, это выглядит как "сужение смысла" или "снятие неоднозначности" только в глазах тек, кто подходит к этому вопросу с позиций вычислительной машины. Ниже мы убедимся, что человек структурирует ситуацию в терминах взаимозависимых значений, так что все остальные возможные значения слова или предложения ему даже не нужно исключать из рассмотрения. Они просто у него не возникают. ** Цит. по: М.Меrleau-Ponty. Sense and Non-Sense. Evanston, M Northwestern University Press, 1964, p. 54. 72 Более того, то или иное выражение глаз может подчеркнуть определенный изгиб носа, который остался бы незаметен на другом лице; нос в свою очередь может превратить улыбку в кривую усмешку, изменив при этом выражение глаз. По замечанию Л.Витгенштейна, "человеческий рот улыбается только на человеческом лице"*. В подобных случаях черты, необходимые для распознавания сходства (бегающий взгляд, насмешливая улыбка и т. д.), даже когда они носят вполне определенный характер, нельзя изолировать, то есть рассматривать нейтрально, вне контекста. Более того, как и в случае уточнения лингвистического смысла, контекст - в нашем примере человеческое лицо - не только определяет существенные для распознавания признаки, но и в свою очередь определяется ими. Выражение лица нельзя вывести из совокупности признаков, оно есть просто соотнесенность глаз, рта и т.д., подобно мелодии, которая, будучи составлена из отдельных нот, сама же и придает им специфические значения. При рассмотрении сходства, основанного на соотношениях такого рода, понятие узнавания в терминах изолированных признаков бессодержательно. Существует еще один тип сходства, при котором предметы, опознаваемые как принадлежащие одному и тому же классу, вообще не имеют каких-либо общих признаков - даже зависящих от контекста. В процессе изучения естественного языка Витгенштейн пришел к исследованию этого типа "неклассификационного" распознавания: "Мы сталкиваемся с очень сложной сетью перекрывающих друг друга и пересекающихся сходств. Иногда эти сходства носят общий характер, иногда касаются лишь деталей. Лучшим выражением такого рода сходств является "фамильное сходство"; моменты сходства, присущие членам одной семьи, такие, как осанка, черты лица, цвет глаз, походка, темперамент и т,д., пересекаются и перекрывают друг друга именно таким образом. ...Мы расширяем наше понятие... подобно тому как при прядении нити скручиваем между собой отдельные волокна пряжи"**. Фамильное сходство отличается от сходства членов одного и того же класса следующими весьма существенными моментами. Классы могут быть заданы в терминах признаков, даже если они не содержат ни одного элемента, в то время как фамильное сходство распознается только в терминах действительных или воображаемых примеров***. Более того, в то время как принад- * L. Wittgenstein. Phjlosophica! Investigations, p. 583. ** Ibid., p, 32. *** Поскольку типичность в отличие от принадлежности к классу зависит от сравнений отдельных примеров, сходство, определяющее тип, должно быть достаточно конкретным. Так, можно говорить о типичном индейце, но не о типичном человеке. 73 лежность к классу есть отношение типа "все или ничего"*, фамильное сходство образует целый спектр признаков, от "типичных" до "нетипичных". Нетипичного члена семьи, например, можно узнать, выстроив в ряд всех членов семьи, начиная с типичного ее представителя и кончая данным нетипичным. Аналогичным образом некоторые понятия, например "изящный", "аляповатый", "вульгарный", невозможно определить в терминах необходимых и достаточных условий; единственный способ дать о них представление- это продемонстрировать типичные случаи. Поскольку подобное распознавание членства в "семье" происходит не с помощью перечня признаков, а путем восприятия данного элемента в терминах близости его к некоторой парадигме (типичному элементу), постольку оно дает нам пример еще одного типа "открытости" и гибкости. Наконец, Витгенштейн идет еще дальше и утверждает, что в некоторых случаях распознавание может происходить при полном отсутствии общих признаков, даже перекрывающихся. Продолжая вышеприведенный отрывок, Витгенштейн говорит довольно туманно: «Если кто-нибудь скажет: "Существует нечто общее для всех этих конструкций, а именно дизъюнкция всех их общих свойств", то п отвечу, что это просто игра слов. С тем же успехом можно сказать: "Нечто проходит через всю нить, а именно непрерывное переплетение составляющих ее волокон")*. Возможно, что Витгенштейн говорит здесь о третьем типе распознавания, который он явно не отделяет от узнавания по сходству; мы могли бы назвать это распознаванием на основе подобия. Витгенштейн в своей интерпретации, по-видимому, имеет в * Интересная попытка перешагнуть через этот дискретный ("все или ничего") характер отношения принадлежности к классу была предпринята Л. Заде (см,, например, L. A. Zadeh. Fuzzy Sets.-"Information and Control". Vol. 8, 1965, № 3, June). Однако в работе Заде (самой по себе интересной) классы все еще определяются в терминах конкретных признаков, просто при определении отношения принадлежности к классу допускается различная степень этой принадлежности. "Расплывчатое множество есть класс объектов, степени принадлежности которых этому классу образуют континуум" (р. 338). Более того, в том смысле, в каком употребляет это понятие Заде, расплывчатость сама по себе является расплывчатым понятием. В своем понятии расплывчатости Заде сваливает в одну кучу пять различных аспектов распознавания образов, а именно, аспекты, относящиеся к нечеткости границ, к зависимости от контекста, цели, субъективной оценки и к фамильному сходству. В результате совершенно непонятно, какой же аспект распознавания поддается формализации при помощи понятия расплывчатости (и поддается ли вообще хоть один) 39. ** L. Wittgenstein. Philosophical Investigations, p. 32. 74 виду не просто необозримый характер соответствующей дизъюнкции, обусловленный тем, что в процессе распознавания используется очень много перекрывающих друг друга признаков, в силу чего ею нельзя оперировать. Последовательно продолжая ход его рассуждений, уместно заключить, что не только каждый из признаков, упоминаемых им при рассмотрении фамильного сходства - осанка, цвет глаз, походка и т. д.,- не совпадает полностью у любых двух членов семьи, но что сами эти признаки в свою очередь представляют собой сеть пересекающихся подобий. Продолжая ту же аналогию, можно сказать, что каждое волокно состоит из волокон, со всеми вытекающими отсюда последствиями. Таким образом, любые два члена семьи могут иметь фамильное сходство и в то же время не иметь никаких идентичных признаков. В анализе Витгенштейна подобие является исходным понятием, несводимым к списку или дизъюнкции идентичных по характеру, жестко определенных черт, как того требует "машинное мышление"*, . Для тех, кто может опознать члена "семьи", не нужно умения перечислять какие бы то ни было точно совпадающие признаки, общие хотя бы для двух ее членов - не говоря уже о том, что нет основания полагать, что такие признаки вообще существуют. Действительно, формализация фамильного сходства в терминах точного подобия признаков привела бы к тому, что оно утратило бы свойство "открытости" для новых случаев,- свойство, которое составляет наиболее яркое проявление феномена узнавания этого типа. Независимо от уже построенного дизъюнктивного списка признаков в "семью" всегда можно ввести новый член, признаки которого будут подобны признакам других ее членов, но в то же время не совпадут точно с какими-либо признаками последних; и тем не менее в некоторых ситуациях этот член можно будет распознать как принадлежащий к той же "семье", что и остальные. Этот сложный, но очень часто встречающийся тип распознавания использует особую комбинацию всех трех вышеописанных форм "переработки информации": периферийное сознание, "инсайт" и обращение к контексту. Начнем с того, что этот процесс протекает в скрытой форме. В нем используется информация, которая остается, так сказать, на краю сферы сознания. Для того чтобы понять, какую роль играет в нем интуиция, мы должны прежде всего выделить различии между "родоотносящим" и "типоотносящим" узнаванием, хотя у А. Гурвича оба эти понятия * Этот анализ получил дальнейшую разработку у Р. Бамбру (R. Bambrough. Universal and Family Resemblances). 75 взаимозаменимы. Согласно Гурвичу, родоотносящее распознавание зависит от скрытых ориентиров, которые всегда можно представить в явной форме. Распознавание типоотносящее - в том смысле, в каком мы до сих пор использовали это понятие,- зависит от подобий, которые не могут быть объективированы. Следовательно, распознавание типичного в отличие от распознавания родового требует интуитивного упорядочения относительно некоторой парадигмы. Парадигма выполняет свои функции постольку, поскольку является самым отчетливым проявлением того, что, по существу, делает все элементы элементами именно данной группы. Наконец, распознавание в терминах близости к парадигме есть не что иное, как форма обращения к контексту. Л.Витгенштейн отмечает, что "осмысленное представление - это именно такое понимание, которое заключается в улавливании связей"*. Следуя Витгенштейну, мы называли эту комбинацию периферийного сознания, "инсайта" и зависимости от контекста "осмысленным разбиением на группы - осмысленной группировкой". Эта форма процесса "переработки информации" человеком не менее важна, чем те три основные формы обработки информации, которые входят в нее как составные части. Расположим в порядке возрастания трудности те условия, при которых человек в состоянии узнавать объекты. 1) Распознаваемый объект может быть повернут, неполон, искажен, сопровождаться шумами, помехами. 2)Признаки, необходимые для узнавания, могут быть столь "тонки и многочисленны", что даже если бы их и можно было формализовать, то все равно по мере добавления новых подлежащих узнаванию объектов с их признаками дерево поиска стало бы чрезвычайно громоздким. 3)Признаки могут зависеть как от внешнего, так и от внутреннего контекста, поэтому их бесконтекстная спецификация может оказаться невозможной. 4)Возможно отсутствие общих признаков при наличии "сложной сети перекрывающихся подобий", которая может служить для выделения все новых и новых вариаций. Следовательно, всякая система, претендующая на адекватность человеческому распознаванию, должна быть в состоянии: 1)для данного конкретного объекта отличать существенные признаки от несущественных; 2)использовать неявные ориентиры, хранящиеся на периферия сознания; 3)учитывать контекст; * Ibid, p. 49. 76 4) воспринимать индивидуальное как типичное, то есть определять отношение индивидуального к некоторой парадигме. Поскольку распознавание образов даже умеренной сложности может потребовать использования всех четырех форм процесса "переработки информации" человеком, исследования в области машинного распознавания объектов не продвинулись дальше многотрудного узнавания простых изображений типа печатных букв разных шрифтов и цифр почтового кода. Но общепризнанно, что до тех пор, пока не произойдет существенного сдвига в работах по распознаванию образов, невозможен дальнейший прогресс в области моделирования игр, автоматического перевода и машинного решения задач. Заключение Итак, мы выяснили, что основная проблема, стоящая перед теми, кто пытается использовать ЭЦВМ для моделирования разумного поведения человека, заключается в необходимости представления каждой альтернативы в четкой форме. При моделировании игр экспоненциальный рост дерева альтернатив требует ограничения числа прослеживаемых путей; в сложных играх, таких, как шахматы, существующие в настоящее время программы не в состоянии выбирать наиболее многообещающие ходы. В проблематике решения задач вопрос упирается не только в то, как вести избирательный поиск по дереву явно заданных альтернатив, но и в то, как структурировать задачу, обеспечив тем самым возможность начала процесса поиска. В области автоматического перевода в связи с тончайшими нюансами, характерными для естественного языка, возникают неясности уже на уровне самих элементов, подлежащих обработке. В распознавании образов безнадежно переплетаются все три вышеупомянутые проблемы; кроме того, дело усложняется тем, что типичность и подобие, по-видимому, являются неотъемлемыми составляющими восприятия. Все эти трудности и явились причиной того, что через пять лет после начала работы над "моделированием процесса познания" в этой области наступило затишье40. Ни одно из предсказаний Саймона не сбылось. Два первых предсказания, касающиеся умения машин играть в шахматы и доказывать математические теоремы, своим провалом поставили под сомнение и третье его предсказание, касающееся психологической теории поведения человека. Несмотря на доверчивость и рвение, с которыми психологи взялись за дело, за протекшие десять лет психологические теории в своем большинстве не приняли форму программ для вычислительных машин. 77 Вместо обещанных триумфов отчетливо проступил общий контур развития: удачное моделирование простых механических форм процесса переработки информации, связанные с этим радужные надежды и, наконец, их крушение при столкновении с более сложными формами поведения. Предсказания Саймона оказались просто еще одним примером явления, которое Бар-Хиллел назвал "обманчивостью первого удачного шага"*. Однако сам Саймон не пришел к такому отрезвляющему выводу. В своем последнем предсказании, сделанном в 1965 г., он заявил, что "не более чем через 20 лет машины смогут выполнять ту же работу, которая под силу человеку"**. Часть II нашей книги посвящена обсуждению причин столь непоколебимого оптимизма. Но сначала мы должны провести анализ работ в области "искусственного интеллекта", пришедшего на смену выдохшемуся "моделированию процесса познания"41 * Работа Э.Тофлера "Грядущий шок" представляет собой блестящую вариацию на ту же тему "первого шага" (см. гл. 2, с. 76). ** H.S imon. The Shape of Automation for Men and Management- New York, Harper and Row, 1965, p. 96. 78 К главе 2 |