Моделирование рассуждений. Опыт анализа мыслительных актов - Дмитрий Поспелов
Шрифт:
Интервал:
Закладка:
К правилам вывода, используемым в исчислении высказываний, в исчислении предикатов добавляются еще три правила.
1. Пусть F1 и F2 – две формулы исчисления предикатов. И пусть в F1 переменная х не входит, а в F2 входит в качестве свободной переменной. Пусть, наконец, формула F1F2 является выводимой. Тогда выводима и формула F1xF2.
2. Если х содержится в качестве свободной переменной в F1 и не содержится в таком виде в F2 и если F1F2 – выводимая формула, то xF1F2 также является выводимой.
3. Если F – выводимая формула и в F есть кванторы общности и существования, то любая из связанных ими переменных может быть заменена на другую связанную переменную одновременно во всех областях действий квантора и в самом кванторе. Полученная после этого формула также является выводимой.
Использование такой системы аксиом и такого множества правил вывода позволяет в исчислении предикатов из тождественно истинных формул получать тождественно истинные.
Вернемся теперь к попытке вложения силлогистических утверждений в исчисление предикатов. Исследование выводимости 24 модусов, верных в силлогистике Аристотеля, в исчислении предикатов привело к следующему результату. Если предполагать, что все классы сущностей непусты, т.е. рассуждения не касаются мыслимых сущностей (например, драконов или русалок), то приведенная выше замена силлогистических выражений выражениями логики предикатов будет полностью справедлива. Другими словами, при непустых классах сущностей все модусы силлогистики Аристотеля выводятся в исчислении предикатов.
Иная ситуация возникает при допущении пустых классов сущностей. В исчислении предикатов предикаты с пустыми областями для аргументов ведут себя совсем не так, как такие же предикаты с непустыми областями. В этих условиях оказываются невыводимыми все модусы силлогистики, в которых вывод носит частный характер, а обе посылки носят общий характер. Например, оказываются невыводимыми модусы AAI и ЕАО первой фигуры:
Хотелось бы обратить внимание читателей на только что полученный результат моделирования. Даже в области дедуктивных рассуждений, дающих всегда достоверные результаты, характер человеческих рассуждений может быть различным. И он не обязан совпадать (как это показывает случай с силлогистикой) с теми схемами рассуждений, которые демонстрирует исчисление предикатов.
Общая схема вывода
Опишем общую схему выводов, лежащую в основе большого количества моделей человеческих достоверных рассуждений. Она приведена на рис. 19. Обратим сначала внимание на рис. 19, а. На нем показано некоторое дерево вывода. Вершинам этого дерева соответствуют определенные утверждения Fi, а дуги определяют порядок получения новых утверждений. Те дуги, которые сходятся в зачерненные точки, образуют конъюнктивные условия вывода, а те дуги, которые между собой соединены «дужкой», образуют дизъюнктивные условия вывода. Например, получение утверждения F9 возможно двумя путями. Если доказаны утверждения F2 и F3, то F7 следует из их доказанности, F6 из доказанности F2 и F9 из доказанности F6 и F7. Другой путь доказательства F9 вытекает из априорной доказанности F3 или F4. Любого из этих фактов достаточно для вывода F8, который обеспечивает выводимость F9.
Рис. 19.
Дерево вывода с такими условиями переходов от вершины к вершине носит название И-ИЛИ дерева. В И-ИЛИ дереве ориентация дуг показывает направление вывода. Естественное разбиение вершин дерева по ярусам отражает глубину вывода (число шагов, необходимых для получения утверждений данного яруса). Первый ярус дерева образуют вершины (на рис. 19, а это вершины F1, F2, F3, F4), играющие роль аксиом или утверждений, истинность которых задается извне.
Схема вывода не обязательно описывается в виде дерева. Она может иметь вид произвольной сети, ориентированной, неориентированной или частично ориентированной. На рис. 19, б показан пример неориентированной сети. Такая сеть (наличие или отсутствие ориентации не играет здесь роли) называется И-ИЛИ сетью. Процесс вывода на И-ИЛИ сети протекает следующим образом. Пусть мы хотим доказать утверждение ?6 (на рис. 19, б этому соответствует целевая вершина). В качестве априорно доказанного задано утверждение ?1 (ему соответствует начальная вершина, которая на рис. 19, б заштрихована). Как из ?1 можно получить ?6? Если считать, что все связи допускают ориентацию в нужную сторону, то из ?1 можно получить ?3, затем ?5 и, наконец, ?6. Но этот путь нам удалось отыскать потому, что сеть, показанную на рис. 19, б, мы видим «с птичьего полета». Лабиринт поиска лежит в виде чертежа перед нами. Именно это позволяет нам не делать лишних попыток, не двигаться в ненужную сторону, а идти кратчайшим путем к цели.
Подобная ситуация приятна, но редко встречается в действительности. При решении любой задачи, даже если заранее известен ее ответ, к которому надо стремиться (для школьника эта ситуация с подглядыванием в ответ до решения задачи весьма типична), мы не видим перед собой полного лабиринта возможностей. Мы пытаемся построить этот лабиринт, видя лишь начальные «площадки лабиринта» и не зная, что лежит между ними и «целевыми площадками». В нашем примере мы стоим на начальной площадке, в вершине ?1, и не знаем, куда идти. Мы делаем попытку перейти в ?2 (т.е. вывести утверждение), но видим, что этого нельзя сделать. Тогда мы движемся в сторону утверждения ?3 и обнаруживаем, что его доказательство возможно. Теперь в нашем распоряжении две площадки лабиринта: ?1 и ?3. Из ?3 можно двигаться в четырех направлениях. Одно из них, ведущее назад к ?1, интереса не представляет. Попытка продвинуться к ?2 и ?5 оказывается успешной. Возникает новый фронт достигнутых площадок (доказанных утверждений). Теперь его образуют ?2, ?3 и ?5. Площадка ?1 исключается из активного фронта, так как использованы все связи этой площадки с другими площадками лабиринта. На следующем шаге достигаются площадки ?4 и ?6. Наличие среди доказанных выражений целевого ?6 позволяет завершить процесс доказательства. После этого можно произвести «чистку», в результате которой останется лишь тот путь, который кратчайшим образом приводит от начального утверждения ?1 к целевому ?6.
На примере мы описали процедуру, которая, как легко видеть, носит универсальный характер и пригодна для поиска пути вывода в лабиринтах произвольного типа. Эта процедура известна среди специалистов под названием метода прямой волны. Волна поиска путей к целевой площадке распространяется от всех площадок, играющих роль начальных.
Возможен и другой способ поиска доказательства. Он носит название метода обратной волны. В этом методе волна начинает свое движение от целевых площадок и движется в направлении начальных площадок лабиринта. Для нашего случая на первом шаге была бы порождена площадка, соответствующая ?5, вслед за этим ?3 и ?1. На этом движение волны прекратилось бы, так как ее фронт достиг всех (в данном случае единственной ?1) начальных площадок.
Различие между прямой и обратной волной состоит в том, что они порождают в процессе своего движения различные промежуточные «фронты» площадок, что приводит к различному числу шагов при поиске. Часто используется смешанный метод вывода, при котором одновременно движутся прямая и обратная волны. При встрече этих волн формируется путь вывода от начальных аксиом к целевым выражениям.
Несколько иной разновидностью схем вывода являются так называемые альтернативные деревья или альтернативные сети. В этих схемах выбор дальнейшего пути движения зависит от того, достигнут или не достигнут вывод некоторого выражения. Другими словами, попытки продвижения по лабиринту, которые мы демонстрировали на методе прямой волны при удачах и неудачах, могут влиять на стратегию дальнейшего движения. Такие схемы вывода мы более подробно рассмотрим в пятой главе. Здесь же лишь проиллюстрируем рассуждение такого типа на примере.