Методы оптимальных решений

👀 4244 просмотра
📌 4169 загрузок

Выбери формат для чтения

Конспект лекции по дисциплине «Методы оптимальных решений», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Методы оптимальных решений», Word формат

МЕТОДЫ ОПТИМАЛЬНЫХ РЕШЕНИЙ Конспект лекций СОДЕРЖАНИЕ ВВЕДЕНИЕ В МЕТОДЫ ОПТИМАЛЬНЫХ РЕШЕНИЙ ..................................... 3 МЕТОДЫ НЕЛИНЕЙНОЙ ОПТИМИЗАЦИИ ....................................................... 15 МЕТОДЫ ЛИНЕЙНОЙ ОПТИМИЗАЦИИ............................................................. 49 МНОГОКРИТЕРИАЛЬНАЯ ОПТИМИЗАЦИЯ ..................................................... 77 МНОГОШАГОВАЯ ОПТИМИЗАЦИЯ .................................................................. 108 ОПТИМИЗАЦИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ ............................. 138 ПРИМЕРЫ ПОЛУЧЕНИЯ ОПТИМАЛЬНЫХ РЕШЕНИЙ ДЛЯ НЕКОТОРЫХ ПРИКЛАДНЫХ ЗАДАЧ ................................................................ 165 2 ВВЕДЕНИЕ В МЕТОДЫ ОПТИМАЛЬНЫХ РЕШЕНИЙ Решение и принятие решений Принятие решений (умение распоряжаться) является центральным элементом административной деятельности, по отношению к которому все остальные могут рассматриваться как вспомогательные. Решение – это результат мыслительной деятельности человека, приводящий к какому-либо выводу или к необходимым действиям. Решение, принятое в социальной системе и направленное на стратегическое планирование, управление управленческой деятельностью, управление человеческими ресурсами, управление производственной и обслуживающей деятельностью, формирование системы управления организации (методология, структура, процесс, механизм), коммуникации с внешней средой, называется управленческим. Как процесс решение – это поиск, группировка и анализ требуемой информации, разработка, утверждение и реализация решения. Как явление решение – это план мероприятий, постановление, устное или письменное распоряжение и т.п. Теория принятия решений – аналитический подход к выбору наилучшего действия (альтернативы) или последовательности действий. Принятие решений – это особый вид человеческой деятельности, направленный на выбор лучшей из имеющихся альтернатив. Это определение предполагает три необходимых элемента процесса выбора: проблема, требующая разрешения; человек или группа, принимающая решение; несколько альтернатив, из которых делается выбор. При отсутствии одного из этих элементов процесс выбора перестает существовать. Будем считать, что лицо, принимающее решения: обладает правом выбора из множества альтернатив; несет ответственность за принятые решения; заинтересовано в осуществлении выбора; стремится разрешить имеющуюся проблему. Хотя эти предложения могут показаться естественными, они выполняются далеко не всегда. Бывают случаи, когда внешние требования, указания вышестоящих организаций практически предопределяют действия руководителя, навязывая ему выбор определенных альтернатив. В других случаях руководитель может быть удовлетворен положением, когда он фактически отстраняется от принятия решений, уступает другим право принятия решений – в этом случае у него нет мотивации к разрешению проблемы. На условия выбора влияет новизна рассматриваемой проблемы. Если одна и та же проблема встречается неоднократно, то у руководителя вырабатываются типовые методы ее решения. 3 Со временем эти методы могут войти в регламентирующие документы, определяющие решение – при этом выбор исчезает. Но существуют уникальные проблемы выбора, когда каждый раз выбор предстает в совершенно другом виде. Это могут быть новые для руководителя объекты выбора (варианты уникальных проектов), либо выбор осуществляется каждый раз в различных условиях (разработка перспективных планов). Такой выбор является наиболее трудным. Он требует выявления основных факторов, влияющих на будущие последствия решения, взвешивания всех «за» и «против». Проблемы уникального выбора При решении проблем выбора в уникальных ситуациях приходится преодолевать ряд существенных трудностей. Многоаспектный характер оценок качества альтернатив. В большинстве случаев оценки качества альтернатив можно приближенно разделить на оценки эффективности и оценки стоимости. Как правило, для рационального решения проблемы необходимо принимать во внимание прямые и косвенные оценки эффективности, оценки с точки зрения внешней среды и побочных явлений. Денежные оценки эффективности являются лишь одними из многих. То же относится и к оценкам потерь, так как многие потери при реализации альтернатив трудно выразить в деньгах. Принимаемые решения могут существенно влиять на различные группы людей, что увеличивает количество возможных оценок. Во многих случаях необходимо учитывать изменения оценок во времени. Трудности выявления всех аспектов сравнения альтернатив. Признание того факта, что альтернативы следует оценивать по многим критериям, делает проблему оценки более реалистичной, но ставит трудный вопрос о полноте списка критериев. Конечно, иногда сама проблема диктует руководителю, что именно надо принять во внимание, а что – отбросить, По чаще всего этот вопрос перерастает в самостоятельную проблему. В ряде случаев набор критериев для руководителя не совпадает с набором для вышестоящей организации и т. д. Трудности сопоставления разнородных качеств. Существование разнородных критериев оценки альтернативы ставит перед руководителем трудные проблемы их сопоставления. Прежде всего, такое сопоставление всегда субъективно и поэтому всегда может быть подвергнуто критике. Крайне трудно, например, найти меру снижения экономической эффективности проекта, эквивалентную определенному уменьшению загрязнения окружающей среды. Эти проблемы усугубляются во много раз при коллективном принятии решений: у каждого из членов коллективного органа, принимающего решения, могут быть разные меры сопоставления разнородных качеств. Одни могут быть заинтересованы в первую очередь в чисто экономических критериях, другие – экологических и т. д. 4 Субъективный характер многих оценок качества альтернатив. Многие из оценок качества альтернатив можно получить либо путем построения специальных моделей, либо путем сбора и обработки экспертных заключений. Как тот, так и другой способы связаны с использованием субъективных оценок либо специалистов, разрабатывающих модели, либо экспертов. Для проблем уникального выбора надежность подобных субъективных оценок, не может быть абсолютной. Даже при полном единодушии экспертов возможен такой поворот событий, когда их оценки окажутся неправильными. Возможно также существование различных моделей либо несовпадение оценок экспертов. Следовательно, несколько альтернатив могут иметь разные оценки, и результат выбора зависит от того, какие из этих оценок будут использованы. Трудность организации работы экспертов. Основным источником информации для оценки альтернатив являются люди, эксперты. Однако получить от них требуемую информацию далеко не просто. Часто от экспертов требуется весьма существенная по объему работа, в то же время лучшие специалисты, как правило, люди занятые, загруженные основной работой. Кроме того, эксперты могут быть пристрастны и отдавать предпочтение какой-либо из альтернатив. Возможно наличие прямого иди косвенного давления на экспертов с целью изменить их оценки в пользу каких-то альтернатив. Естественно, что руководитель заинтересован в получении по возможности беспристрастной информации. Лицо, принимающее решение стремится найти компетентных экспертов, которые выступали бы в виде беспристрастных измерителей качеств альтернатив. Но так как в ряде ситуаций люди субъективны и пристрастны, а круг лучших экспертов для многих проблем сравнительно узок, то проблема получения надежной информации от экспертов далеко не проста. Трудности получения полного списка альтернатив. Иногда оказывается, что лучшее решение проблемы связано с новым взглядом на нее, т.е. с поиском новой альтернативы. Проблема полноты списка альтернатив является одной из сложных проблем в процессе выбора. Количественная оценка альтернатив В современных условиях глубоко укоренившейся традицией является отождествление научного понимания явления с возможностью его количественного анализа. Научное обоснование любых выводов предполагает применение методов, допускающих проверку и повторение полученных результатов другими исследователями. Отмеченная традиция научного мышления зародилась в сфере естественных наук, прежде всего в физике. С течением времени, особенно с развитием вычислительной техники, количественные методы нашли широкое применение при анализе экономических, социальных, биологических и других систем. 5 Оптимальные решения Теория принятия решений является дисциплиной, занимающейся научным обоснованием решений. Научное обоснование решений – это, прежде всего количественная оценка возможных альтернатив и выбор наилучшей из них по некоторому объективному критерию. Поэтому в количественной теории принятия решения в качестве критерия оптимальности может выступать только такой, который допускает количественную оценку. В количественной теории принятия решений широко оперируют понятиями показатель и критерий. Зачастую в практических приложениях их используют как равнозначные, что может привести к ошибочным постановкам задач. Дадим определения этим понятиям применительно к теории принятия решений. Показатель – это количественная оценка какогото свойства изучаемого объекта. Свойства технических и экономических объектов обычно многогранны. Следовательно, для их количественной характеристики должна быть использована совокупность многих показателей. Так, например, транспортный самолет можно охарактеризовать с помощью таких показателей, как крейсерская скорость, беспосадочная дальность полета, грузоподъемность, взлетный вес, потребная длина взлетной и посадочной полосы, и многих других. Критерий – это средство для количественной оценки решений, сравнения их между собой и выбора наилучшего (оптимального). Поскольку критерий оптимальности есть количественная мера степени достижения цели управления, математически цель управления выражается в стремлении к максимально возможному увеличению (или уменьшению) значения критерия. Средством достижения этой цели является соответствующий выбор значений управляемых факторов областей их допустимых значений. Таким образом, общая постановка задачи принятия решений может быть сформулирована так: при заданных значениях и характеристиках фиксированных неконтролируемых факторов с учетом неопределенных факторов найти оптимальные значения управляемых факторов из областей их допустимых значений, которые по возможности обращали бы в максимум (минимум) критерий оптимальности. Процесс принятия решений Процесс принятия управленческого решения – это преобразование исходной информации (информации состояния) в выходную информацию (информацию управления – приказ). Решение может быть формальным и творческим. Если преобразование информации выполняется с помощью математических моделей, то выработанное решение считается формальным, если решение появляется в результате скрытой работы интеллекта человека, принимающего решение, то оно – творческое. Чисто формального или чисто творческого решения 6 не существует. Если решение вырабатывается с помощью математической модели, то знания и опыт человека используются при еѐ создании, а интуиция – в момент, когда он задает то или иное значение параметра исходной информации или выбирает из множества альтернативных вариантов, полученных с помощью математической модели, один в качестве управляющего решения. Если основным инструментом выработки решения является интеллект человека, то формальные методы, носителем которых практически является вся наука, скрыто присутствуют в его знаниях и опыте. Для ситуаций, в которых происходит выбор решений, характерно: 1. Наличие цели (целей): Необходимость принятия решения диктуется только наличием некоторой цели, которую следует достичь. Если цель отсутствует, то не возникает и необходимость принимать какое-либо решение. 2. Наличие альтернативных линий поведения: Решения принимаются в условиях, когда существует более одного способа достижения поставленной цели. Каждый из способов может характеризоваться различными степенями и различными вероятностями достижения цели, требовать различных затрат. 3. Наличие ограничивающих факторов: Естественно, что лицо, принимающее решение, не обладает бесконечными возможностями. Все множества ограничивающих факторов можно разбить на три группы: a. экономические факторы – денежные средства, трудовые и производственные ресурсы, время и т.п. b. технические факторы – габариты, вес, энергопотребление, надежность, точность и т.п. c. социальные факторы, учитывающие требования человеческой этики и морали. Процессы принятия решений, реализуемые в самых различных сферах деятельности, имеют очень много общего, поэтому желательно иметь некоторую универсальную, «типовую» схему процесса принятия решений, устанавливающую наиболее целесообразный набор и последовательность действий, производимых при решении задачи принятия решений. Процесс принятия решений включает последовательное решение следующих задач: 1. формирование альтернатив решения; 2. сравнение альтернатив; 3. выбор лучшей альтернативы; 4. реализация выбранной альтернативы; 5. контроль результатов. Процесс принятия решений является сложной итеративной циклической процедурой. Действительно, результат практически любого этапа может повлиять на постановку задачи и привести к ее изменению. В частности, даже прак- 7 тическое опробование принятого решения, если оно дает нежелательный результат, также является стимулом к пересмотру постановки задачи и поиску новых решений. Чаще всего ЛПР хочет принять не просто какое-либо решение, а «самое хорошее, лучшее решение» – оптимальное решение. Оптимальность решения задается в терминах оптимальности целевой функции. Для дальнейшего изложения введем несколько удобных математических обозначений.  extr – экстремум. Это общее обозначение для максимума ( max ) и минимума ( min ). Обозначение удобно для общности записей, так как в ряде управленческих задач необходимо максимизировать результат, а в ряде – минимизировать, а используемые при этом методы едины.  F  extr – добиться экстремальности результата функции F . Аналогично F  max – добиться максимальности результата функции F и F  min – добиться минимальности результата функции F . (Не путать с пределом!)   – обозначение оптимальной величины. Например, самое большое значение функции F  x  будем обозначать F  . Соответственно, значения переменной x , при котором функция принимает это значение, обозначается x . То есть F   F  x  .  x – оптимальное решение. Именно получение оптимальных решений, отвечающих на вопрос «Что делать?», и является основной целью задач оптимального принятия решения. Основные методы принятия решений Лицо, принимающее решение обозначим как ЛПР. В качестве ЛПР может выступать как отдельный человек, так и коллективный управляющий орган. При принятии решения можно выделить пять макроподходов:  аналитический;  интуитивный;  эмоциональный;  случайный (вероятностный);  опытный (экспериментальный, экспертный). Жестко разделить эти подходы, конечно, нельзя. Сложно указать, где граница между аналитическим взглядом и интуицией, а где – между интуицией и эмоциями и т. п. Кроме того, решения редко принимаются с использованием 8 только одного подхода. Чаще всего при принятии решения присутствуют сразу несколько подходов в их органичном переплетении. Отдельно можно выделить подходы или методы формирования общего коллективного решения на основе индивидуальных решений участников коллектива. Однако участники коллектива также принимают свои решения с использованием этих пяти подходов и их всевозможных комбинаций. Аналитические методы принятия решений Рассмотрим наиболее общую модель аналитического подхода к принятию решения. В этом подходе всегда можно выделить следующие параметры:  S – состояние. Это набор параметров, характеризующий состояние системы с точки зрения рассматриваемой проблемы в результате которой нужно принимать решение. Параметры состояния могут быть более или менее значимы в рассматриваемой ситуации. Умение обозначить основные параметры состояния является важнейшим этапом подготовки к принятию решения. Параметр состояния отвечает на макровопрос «При каких условиях?».  x – управление. Это набор параметров, с помощью которых ЛПР может осуществлять управление. Умение определить, какими управляющими параметрами обладает ЛПР, также является важным этапом подготовки принятия решения. Нахождение наилучшего (или как минимум допустимого) управления – основная задача принятия решения. Управление отвечает на макровопрос «Что делать?». В каждой конкретной задаче формулировка этого вопроса может быть конкретизирована.  F – функция цели (целей). Это один или несколько параметров, характеризующих результаты деятельности вследствие принятых решений. Функция цели может быть одна (однокритериальная проблема) или несколько (многокритериальная проблема принятия решения). Результат деятельности зависит от ситуации, в которой находится система, от принятых решений и, возможно, еще от каких-либо факторов, которые невозможно учесть ЛПР на момент принятия решения. В терминах функции цели можно записать: F  F  S , x,... , 9 то есть F является функцией параметров состояния, параметров управления и, возможно, еще каких-то параметров. Четкая формулировка цели и осознание ее зависимости от возможного управления – не менее важный этап постановки задачи принятия решения. Функция цели отвечает на макровопрос «С какой целью?».   – функция состояния. Эта функция показывает, как меняется состояние системы в зависимости от выбранного управления (и соответствующей ему деятельности). В ряде задач эта функция может не использоваться, потому что состояние системы не меняется в результате управления или его изменение не важно для ЛПР. Можно записать: Snew    Sold , x,... , то есть новое состояние зависит от старого состояния, от выбранного управления и еще каких-то параметров. Функция состояния отвечает на макровопрос «Что будет потом?». Общая классификация задач теории принятия решений В методах принятия управленческих решений возможны разные типы классификаций, многие из которых будут рассмотрены в соответствующем разделе дисциплины. На данный момент рассмотрим только два вида. 1. Классификация по определенности (детерминированности) ситуации. Ситуации бывают:  детерминированные (определенные) – когда достаточно жестко определены все взаимосвязи между параметрами;  вероятностные (случайные, стохастические) – когда взаимосвязи между величинами носят случайный, вероятностный характер. В качестве примера детерминированной ситуации можно привести выполнение предоплаченного заказа в заданные сроки. В этом случае известны доходы от производства, цены поставщиков и т. п. Целью деятельности является оптимизация затрат, которые понятным образом зависят от вариантов деятельности. Примером вероятностной ситуации является завоз товара частным предпринимателем на продажу. В этом случае заранее неизвестно, по какой цене, в каких количествах и за какое время будет продан товар. Предприниматель лишь имеет вероятностные оценки возможных значений этих параметров. Чаще всего реальные ситуации имеют как детерминированные, так и вероятностные связи. Как детерминированные мы будем рассматривать ситуации, в которых влияние случайности очень невелико. 10 2. Классификация по определенности получаемого решения. Полученные решения могут быть:  точные (определенные) – когда решение должно быть выполнено точно, а отклонения невозможны;  приближенные (примерные, наводящие) – когда решение предлагает только «реперный» план деятельности, а конкретная реализация деятельности может быть подкорректирована в зависимости от реальной ситуации. Примером приближенного решения является бюджет государства на 3 года. Он задает рамки трат государства, общие пропорции. Но конкретная реализации достаточно сильно зависит от текущей ситуации и многих других факторов. Ярким примером точного решения является выбор какого-либо сложного товара, например, телефона. Нельзя «собрать» телефон понемногу из отдельных частей и показателей всех возможных телефонов, подкорректировав их «по месту». Необходимо определиться в выборе и купить что-то одно. Заметим, что два вида классификации не связаны друг с другом, несмотря на похожие названия. Возможны случаи, когда ситуацию можно считать детерминированной, а решение получается приближенным. Например, задача определения плана выпуска продукции заводом из фиксированных ресурсов можно считать детерминированной, но полученный план все равно будет не очень точен и из-за ряда причин он может быть, как недовыполнен, так и перевыполнен. И, наоборот, в некоторых вероятностных ситуациях решение необходимо принимать точное. Например, выбор поездки на отдых в конкретное место – точное решение, хотя сама ситуация может сильно зависеть от внешних факторов: погоды, экономической ситуации и т. п. Математические методы и модели в принятии решений. Основные понятия экономико-математического моделирования В ряде случаев, когда между параметрами можно записать детерминированные связи или построить вероятностные оценки, удается получить оценку оптимального решения математическими методами. Для этого необходимо сформулировать экономико-математическую модель. Ее построение идет по следующим этапам: 1. Выбор искомых переменных (искомого управления, плана, программы). Важным требованием к этому этапу является такой выбор переменных, чтобы на их основе можно было записать все взаимосвязи в задаче и после их определения сделать выбор необходимых действий. 11 2. Формирование функции цели (одной или нескольких). Функция цели должна зависеть только от искомых переменных, выбранных на первом этапе, и известных величин. Функция цели должна максимизироваться или минимизироваться. Бывают случаи, когда функция цели должна быть как можно ближе к заданной величине. 3. Формирование системы ограничений. Все ограничения тоже должны быть выражены только от искомых переменных, выбранных на первом этапе, и известных величин. Важно записать все ограничения, не забывая даже самые очевидные. 4. Если необходимо: формирование функций состояния, показывающих, как меняется состояние системы в зависимости от выбранных искомых переменных. Оптимизационная задача – это экономико-математическая задача нахождения оптимального (максимального или минимального) значения целевой функции f ( x1, x2 , , xn ) в некоторой допустимой области W значений переменных xi , i  1, 2, , n . Математически в самом общем виде задача оптимизации экономической задачи записывается так:  f ( x1, x2 , , xn )  max; (3.13)   xi W , i  1, 2, , n. В дальнейшем для сокращения записи введем векторные обозначения, полагая X  ( x1, x2 , , xn ) . Для того чтобы решить задачу оптимизации, достаточно найти ее оптимально решение, т. е. указать такой вектор значений X 0 W (в экономике это решение часто называют оптимальным планом), для которого выполняется условие f ( X 0 )  f ( X ) для всех X W . Задача поиска минимума сводится к задаче (3.13) поиска максимума функции простой сменой знака целевой функции f ( x1, x2 , , xn ) . Оптимизационная задача является неразрешимой, если она не имеет оптимального решения на допустимой области значений функции. Классификация экономико-математических моделей. Математические методы разработки оптимальных решений Определяющим признаком классификации может служить степень определенности возможных исходов или последствий различных действий, с которыми сталкивается лицо, принимающее решение. По этому признаку можно выделить три типа моделей: 12  выбор решений в условиях определенности, если относительно каждого действия известно, что оно неизменно приводит к некоторому конкретному исходу;  выбор решения при риске, если каждое действие приводит к одному из множества возможных частных исходов, причем каждый исход имеет вычисляемую или экспертно оцениваемую вероятность появления. Предполагается, что ЛПР эти вероятности известны или их можно определить путем экспертных оценок;  выбор решений при неопределенности, когда то или иное действие или несколько действий имеют своим следствием множество частных исходов, но их вероятности совершенно не известны или не имеют смысла. Вторым признаком классификации является количество критериев, по которым оценивается качество принимаемых решений. По этому признаку задачи принятия решений делятся на однокритериальные и многокритериальные. По третьему классификационному признаку задачи принятия решений делятся на два больших класса: статические и динамические. В статических задачах принятия решений критериальная функция и функции ограничений не зависят от времени. В динамических задачах принятия решений выступает обычно не функция, как в статических, а функционал, зависящий от функций времени, описывающих поведение некоторых динамических объектов. В качестве примера динамической задачи принятия решений можно привести задачу вывода космического летательного аппарата в заданную точку пространства с заданной точностью и за заданное время с минимальным расходом топлива. В настоящее время динамические задачи принятия решений еще не получили широкого применения и поэтому в дальнейшем не рассматриваются. Любая реальная задача принятия решений может удовлетворять одновременно нескольким из перечисленных выше классификационных признаков, т.е. представлять собой комбинацию из рассмотренных классов. Отнесение реальной задачи принятия решения к одному из классов рассмотренной классификации определяется точкой зрения и информированностью исследователя, а также необходимой или возможной глубиной исследования проблемы. Методы решения оптимизационных задач зависят как от вида целевой функции f ( X ) , так и от строения допустимого множества значений аргументов целевой функции W (в экономике это множество также называют множеством допустимых планов). Математическим программированием называется раздел математики, посвященный теории и методам поиска экстремума в задачах оптимизации, для которых вектор X принадлежит конечномерному векторному пространству, а область ограничений W определяется системой равенств или неравенств. 13 В свою очередь, в математическом программировании в зависимости от вида целевой функции f ( X ) и вида области ограничения W принято выделять задачи:  линейного программирования;  нелинейного программирования;  целочисленного программирования;  стохастического программирования;  динамического программирования. В дальнейшее мы рассмотрим различные постановки и примеры решения задач математического программирования. Примеры задач поиска оптимального решения в прикладных задачах Примерами задач поиска оптимального решения могут служить такие важные задачи практической деятельности, как:  поиск оптимального плана поставок товаров;  поиск оптимального выпуска продукции при ограниченных ресурсах;  определение оптимального варианта транспортной доставки;  поиск оптимального маршрута;  определение оптимальных параметров комплекса работ;  определение оптимального распределения ресурсов между подразделениями;  определение оптимальной стратегии деятельности;  и мн. др. Математическое моделирование управления запасами используется для оценки оптимального запаса материальных ресурсов, предметов потребления, товаров различного вида и т. п. с целью удовлетворения спроса на некотором интервале времени. В любой задаче управления запасами требуется определять количество заказываемой продукции и сроки размещения заказа. 14 МЕТОДЫ НЕЛИНЕЙНОЙ ОПТИМИЗАЦИИ Классические методы нелинейной оптимизации. Методы определения экстремумов функции одной переменной Задачи нелинейной оптимизации относятся к задачам принятия решений в полностью детерминированных условиях при наличии непропорциональных связей каких-либо параметров от искомых переменных. Таким образом, в этих задачах обязательно:  известна зависимость функции выигрыша (например, прибыли) от искомого плана;  известны зависимости всех ограничивающих факторов от искомого плана;  хотя бы одна из зависимостей (функция выигрыша или ограничение) меняется непропорционально изменению составляющих плана. В качестве примера рассмотрим такую задачу. Решение задачи одномерной нелинейной оптимизации: f  x   extr при каких-либо ограничениях на переменную x может быть только в таких точках X , которые удовлетворяют хотя бы одному из условий:  f  X   0 ;  f   X  – не существует (например, если точка X – точка изменения вида функции – точка разрыва или излома);  X – граничная точка;  X – бесконечноудаленная точка. Пример На лесозаготовительном комбинате работает 70 человек. Основными переменными расходами являются суммарные расходы на каждого работника (заработная плата, налоги, страховки, затраты на спецодежду и т.п.). Эти расходы равны 80 тыс. руб. в месяц. Каждый работник за месяц обеспечивает производство 25 м3 древесины. Доход от продаж древесины составляет примерно 16,5 – 17 миллионов рублей в месяц. На предприятие приходит новый директор, который ставит вопрос о возможности оптимизации работы. Изучив ситуацию, он устанавливает следующее:  Доход от сбыта древесины может быть хорошо описан зависимостью: I  400 y , где R – доход в тыс. руб., y – количество древесины в м3, предлагаемой на продажу в месяц.  Имеются дополнительные рабочие, желающие работать на нашем предприятии на тех же условиях, что и имеющиеся сотрудники. 15 Но необходимо организовывать доставку новых сотрудников к месту работ. Затраты на доставку новых рабочих составят 20 тыс. руб. в месяц на человека.  Уволить более 30 человек нельзя.  Администрация региона согласна безвозмездно субсидировать предприятие в размере 300 тыс. руб. в месяц, если на нем будет создано не менее 150 рабочих мест. Таким образом, перед директором встают такие вопросы:  Оптимально ли имеющееся количество рабочих?  Нужно ли нанять новых рабочих, а возможно стоит уволить кого-то из имеющихся?  Имеет ли смысл нанимать большее количество рабочих для получения субсидии? Данная задача является детерминированной, так как все зависимости точно определены. Кроме того, задача является нелинейной по трем причинам: 1) доход нелинейно зависит от производства; 2) расходы на рабочих меняют коэффициент пропорциональности после 70 человек; 3) имеется разрыв функций – при найме от 150 человек предприятие получает субсидию. Постановка задачи нелинейного программирования для функции нескольких переменных. Методы безусловной оптимизации 1. Понятия глобального, локального и условного экстремумов 1.1. Функция нескольких переменных F  x1, x2 , , xn  имеет глобаль-  x x1 , x2 , ный максимум в точке x  x1, x2 , , xn  справедливо условие:  F  x1, x2 , , xn   F x1 , x2 , , xn , xn , если для любой другой точки  1.2. Функция нескольких переменных с имеет локальный максимум в x x1 , x2 , , xn  точке , если существует малая окрестность точки x , такая, что для любой точки x  x1, x2 , , xn  из этой окрестности справедливо условие:    F  x1, x2 , , xn   F x1 , x2 , , xn  Очевидно, глобальный экстремум будет одним из локальных. 1.3. Пусть на n переменных наложено m условий: 16 1  x1 , x2 , , xn   0   2  x1 , x2 , , xn   0     x , x , , x   0 n  m 1 2 (1) Функция нескольких переменных F  x1, x2 , , xn  имеет условный макx x1 , x2 , , xn симум (глобальный или локальный) в точке , если:  1) точка x удовлетворяет условиям (1);  2) для любой другой точки (любой или из малой окрестности точки x ), удовлетворяющей системе (1) справедливо условие: F  x1, x2 , , xn   F x1 , x2 , , xn     1.4. Глобальный, локальный и условный минимумы записываются аналогично, только знак меняется на  . Заметим, что целью решения задач оптимизации является именно набор x x1 , x2 , , xn переменных , а не максимальное или минимальное значение  функции. Зная x можно всегда определить значение функции подстановкой этих аргументов в функцию, зная же только значение функции, определить значение аргументов, при котором оно достигается, невозможно. В терминах управления это можно сформулировать так: необходимо найти что делать для наилучшего результата, а не знать, каков этот результат без знания путей его достижения. 2. Понятие градиента Градиент – вектор (набор) частных производных от функции по ее аргументам:  F F F  grad F  F   ; ; ;  xn   x1 x2   Градиент как вектор, вычисленный в точке, показывает направление наискорейшего роста функции в этой точке. Градиент равен нулю когда все его компоненты равны нулю. Градиент является расширением понятия производной на многомерный случай. Для случая одной переменной градиент просто заменяется на производную функции. 3. Необходимое условие локального безусловного экстремума во внутренних точках 17 Если дифференцируемая функция F  x1, x2 , , xn  имеет локальный экс* тремум во внутренней (не бесконечной) точке x , то ее градиент в этой точке равен нулю. Условие является необходимым, но не достаточны. Возможны случаи, когда во внутренней точке градиент равен нулю, но у функции там не будет ни минимума, ни максимума. Пример. F  x, y   3xy  x 2  2 y 3 .  F F  2 grad F   ;   3 y  2 x; 3x  6 y  x y  .   x   0;0   grad F  0   9 3 x   ;   8 4  Таким образом, внутри у функции может быть локальный максимум или минимум только в двух точках. Более подробный анализ показывает, что первая точка не является точкой экстремума. Вторая точка – точка локального минимума. Методы условной оптимизации. Метод Лагранжа. Экономическая интерпретация множителей Лагранжа 4. Способы определения условного экстремума Пусть требуется решить задачу на отыскание условного экстремума: F  x1, x2 , , xn   extr 1  x1 , x2 , , xn   0   2  x1 , x2 , , xn   0     x , x , , x   0 n  m 1 2 (1) Существуют два подхода к решению. 4.1. Выражение одной переменной через другие. Можно выразить из условий (1) некоторые переменные через другие и подставить в функцию. Получим задачу на безусловный экстремум. Достоинства подхода:  снижается число переменных;  снижается число уравнений;  подход интуитивно понятен. Недостатки:  навязывается неравнозначность переменных (основные и зависимые); 18  после исключения сложно проанализировать влияние условий;  очень часто не удается явно выразить одну переменную через другие. Последний недостаток оказывается критичным и непреодолимым при сложных зависимостях. 4.2. Метод множителей Лагранжа.  Для каждого ограничения j вводится неизвестный множитель j . После этого ищется безусловный экстремум для функции Лагранжа:   x1, x2 , , xn    F  x1, x2 , , xn   11  x1, x2 , , xn   22  x1, x2 , , xn    mm  x1, x2 , , xn  То есть записываются n  m условий:       x    0  1  1     0 0   ,  x2  2           x    0  n  m второй столбик условий, очевидно, является системой условий (1). Недостатки подхода:  подход интуитивно не очевидный;  увеличивается количество неизвестных и количество уравнений;  сложные зависимости остаются в системе. Достоинства:  всегда удается записать всю систему уравнений до того, как приходится выражать одну переменную через другие, следовательно, такой подход универсален;  множители Лагранжа имеют четкий смысл и позволяют проанализировать влияние ограничений. Смысл множителей Лагранжа. Множитель Лагранжа, определенный для ограничения, показывает относительное изменение оптимального значения целевой функции при изменении правой части ограничения. То есть, если правая часть какого-либо из ограничений (1) изменится на некоторое значение, то и оптимальное значение функции тоже изменится. Отношение изменения функции к малому изменению ограничения равно множителю Лагранжа. Кроме этого, множителя Лагранжа продолжают играть важную роль для задач нелинейного программирования, когда вместо ограничений равенствами (1) присутствуют ограничения соответствующими неравенствами (  вместо 19  ). Тогда ненулевой множитель Лагранжа означает выполнение в оптимальном случае соответствующего ограничения как равенства и имеет такой же смысл как для равенств. Нулевой множитель Лагранжа говорит о том, что в оптимальном случае соответствующее ограничение выполнено как строгое неравенство. 4.3. В качестве третьего подхода можно рекомендовать комбинировать оба способа. Выразить те переменные, которые легко выражаются через другие. Подставить всюду, тем самым, сократив число переменных и ограничений. Далее использовать способ Лагранжа. 5. Теорема Куна-Таккера для задачи нелинейной оптимизации. Простейшая интерпретация и способ применения Теорема Куна-Таккера – основная теорема, дающая возможность решить аналитически задачи нелинейного программирования (оптимизации). Общая математическая формулировка теоремы достаточно сложна. Здесь мы приведем ее упрощенный вариант, позволяющий решать конкретные задачи оптимизации, возникающие в экономике и управлении. Для задачи нелинейного программирования: F ( x1, x2 , , xn )  extr 1  x1 , x2 , , xn   0   2  x1 , x2 , , xn   0     x , x , , x   0 n  m 1 2 (2) необходимым для точки экстремума является выполнение одного из условий: 1) равенство нулю градиента функции в этой точке; 2) отсутствие градиента функции в точке; 3) равенство нулю хотя бы одного из ограничений (2); 4) бесконечная точка. Заметим, что равенство нулю ограничений (2) достигается на границе области. * Тогда для отыскания наилучшего значения функции и переменных x , при которых оно достигается необходимо выполнить следующий алгоритм поиска глобального экстремума: 1) найти градиент функции; 2) определить все точки, где градиент равен нулю; в тех из них, которые удовлетворяют ограничениям, вычислить значение функции; 3) определить все точки, где градиент не существует; в тех из них, которые удовлетворяют ограничениям, вычислить значение функции 20 (если возможно); для точек разрыва функции определить значения функции при стремлении к точке разрыва со всех сторон; 4) определить максимальные и минимальные значения функции на границах области; 5) исследовать функцию на бесконечности, найти там максимальное и минимальное значение функции; 6) из определенных значений функции во всех потенциально возможных местах экстремума выбрать самое большое (при поиске максимума) или самое маленькое (при поиске минимума); точка, в которой достигается это значение, будет решением задачи оптимизации. В общем случае проделать эти операции очень непросто. В п.п. 2) и 3) градиент может быть равен нулю или не существовать в бесконечном количестве точек – например на линии или на поверхности в многомерном пространстве. Пункт 4) вообще приводит к самостоятельной задаче поиска условного экстремума. Исследование функции на бесконечности – тоже нетривиальная задача. Специфика задач экономики и управления заметно упрощает применение этих операций. Во-первых, в экономических постановках на бесконечности никогда не бывает интересующего нас варианта. Бесконечность или недостижима из-за ограничений, или там реализуется обратный случай. Например, можно достигнуть бесконечных убытков, однако это не представляет интереса. Таким образом, пункт 5) в задачах экономики как правило не исследуется. Во-вторых, точки, где градиент не существует, в детерминированных экономических постановках бывают известны заранее. Такие точки, соответствующие изломам и разрывам функции, всегда должны иметь экономическое обоснование. Примером могут служить количество товара, при котором начинает действовать скидка, величина дохода, когда меняется ставка налогообложения и т.п. В нашем примере про лесозаготовительный комбинат градиент не существует при количестве рабочих 70 (излом – начинает действовать другая величина затрат на человека) и 150 (разрыв – выплачивается субсидия). В-третьих, используемые для описания экономических ситуаций функции достаточно просты и имеют, как правило, всего несколько точек, где градиент равен нулю или не имеют таких вообще. Разбор примера задачи нелинейной оптимизации Решим и проанализируем описанную выше ситуацию принятия решения для директора лесозаготовительного комбината. Анализ будем проводить только с учетом переменных расходов. Как следует из общей теории оптимизации, постоянное слагаемое не оказывает 21 влияние на оптимальный план действий, изменяя только значение целевой функции. Как видно из данных примера, весь анализ можно провести в терминах количества рабочих. Обозначим через x число рабочих на предприятии. Так как мы не можем уволить более 30 человек из имеющихся 70, то переменная x ограничена снизу: x  40 . Выпуск продукции пропорционален численности и равен y  25 x м3 в мес. Доход от продажи в месяц тогда равен: I  400 y  400 25x  2000 x Если возможную субсидию при x  150 учесть в доходной части, то общую функцию месячного дохода можно записать так:  x  150 2000 x , I   2000 x  300, x  150 (3) Если не нанимать новых сотрудников, то будет выполняться условие x  70 , а месячные расходы равны: R  80 x, x  70 . Если нанять новых рабочих, то x  70 . Из этого количества рабочих 70 будут «старых», а  x  70  – «новых». Тогда месячные расходы будут складываться из затрат на «старых» по 80 тыс. руб. на человека и затрат на новых по 80  20  100 тыс. руб. на человека. Суммарные затраты составят: R  80  70  100   x  70   100  x  1400, x  70 . В итоге общую функцию месячных затрат можно записать в виде: x  70 80 x, R 100  x  1400, x  70 (4) Прибыль комбината (без учета постоянных расходов) равна разнице между доходами (3) и переменными расходами (4) и запишется в виде: 2000 x  80 x, 40  x  70  P  2000 x  100  x  1400, 70  x  150  2000 x  100  x  1700, 150  x   (5) Таким образом, математически задача формулируется так: найти x , при котором функция прибыли (5) имеет максимум. Очевидно, функция (5) меняется непропорционально искомой переменx ной и задача является нелинейной. Пройдем для этой задачи все пункты алгоритма поиска глобального экстремума. 22 1) Определим градиент функции. В данном случае функции одной переменной градиент совпадает с производной. Если функция задана разными выражениями на разных интервалах, то нужно просто взять производные для каждого интервала. Они будут справедливы при строгом выполнении ограничивающих интервалы неравенств: 1000  x  80, 40  x  70  1000 P    100, 70  x  150 x  1000  100, 150  x     x (6) Как видно из выражения (6), производные на втором и третьем интервалах совпадают, но между ними при x  150 производная не существует, так как функция терпит разрыв. 2) Определим точки, где производная равна нулю. Для этого определим все x , удовлетворяющие равенствам: 1000  x  80  0, 40  x  70  1000  100  0, 70  x  150  x  1000  100  0, 150  x     x Рассмотрим интервал 40  x  70 . На нем имеем уравнение: 1000  80  0 x . Решая уравнение, находим 1000 x  12,5  x  12,52  156,25 80 . Однако данное значение не попадает в интервал: 156,25  40;70  . Значит на указанном интервале нулей производной нет. Рассмотрим интервал 70  x  150 . На нем имеем уравнение: 1000  100  0 x . Решая уравнение, находим 1000 x  10  x  102  100 100 . 23 Данное значение принадлежит рассматриваемому интервалу: 100   70;150  . Таким образом, x  100 является корнем производной. Рассмотрим интервал 150  x   . На нем имеем уравнение: 1000  100  0 x . Решая уравнение, находим 1000 x  10  x  102  100 100 . Это значение не принадлежит рассматриваемому интервалу: 100  150;   . Значит на указанном интервале нулей производной нет. Итак, производная равна нулю только в точке x  100 . Определим значение функции в этой точке: P 100  2000 100  100 100  1400  20000  10000  1400  11400 . То есть наняв 100 рабочих получим прибыль, равную 11400 тыс. руб. 3) Определим точки, где производная не существует. Это все точки границ интервалов. Найдем в них значение функции. В точке x  70 функция имеет излом, но остается непрерывной. Ее значения с обеих сторон совпадают и равны: P  70   2000 70  80  70  16733  5600  11133 . Если останутся прежние 70 рабочих, то прибыль будет 11133 тыс. руб. В точке x  150 функция имеет скачек. Ее значения разные с двух сторон. При x  150 предел будет равен: lim P  x   2000 150  100 150  1400  24495  15000  1400  10895 x1500 . При x  150 предел будет равен: lim P  x   P 150   2000 150  100  150  1700  24495  15000  1700  11195 x1500 Таким образом, наняв 150 рабочих получим прибыль, равную 11195 тыс. руб. Замечание 1. В данной задаче из условия целочисленности числа рабочих можно было не искать значения пределов, а проверить значение прибыли при 150 и 149 рабочих. Замечание 2. Из экономического смысла задачи очевидно, что предел справа (когда субсидия будет выплачена) будет лучше, чем предел слева (без субсидии). 4) Единственной границей области в данном случае является x  40 . При этом значении: 24 P  40   2000 40  80  40  9449 . То есть при 40 работниках прибыль будет равна 9449 тыс. руб. 5) Поведение функции на бесконечности можно не рассматривать, как в задачах экономики. Однако, если это сделать, то получим: P  x     lim 2000 x  100  x  1700   x . Как и ожидалось, нанимая неограниченное количество рабочих будем получать неограниченные убытки. 6) Из всех найденных значений целевой функции выберем самое большое. Собираем все значения вместе: P  40   9449 ,   P  70   11133 , P 100   11400 , P 150   11195 , P      . Как видно, наибольшее значение P  11400 достигается при x  100 . Таким образом, оптимальное управленческое решение будет таким:  Необходимо привлечь к работе всего 100 человек: 70 уже имеющихся и 30 новых. В этом случае мы получим наибольшую прибыль, равную 11 миллионов 400 тысяч рублей. Ответить на вопросы, поставленные перед собой новым руководителем, можно так:  Имеющееся количество рабочих не оптимально. Необходимо нанять еще 30 человек. Нанимать рабочих до 150 человек не выгодно, так как получаемая субсидия вместе с ростом доходов не компенсирует полученный рост расходов. Сделаем еще несколько замечаний.  Если мы сравним суммы прибыли при текущем количестве рабочих (11 млн. 133 тыс. руб.) и оптимальным (11 млн. 400 тыс. руб.), то видно, что прибыль меняется всего на 267 тыс. руб. или менее чем на 3%. Необходимо как следует проанализировать, стоит ли менять сложившийся вариант работы ради таких незначительных изменений. Для анализа необходимо уже будет учесть постоянные издержки. Если они велики, то прибыль с их учетом становится значительно меньше и дополнительные 267 тыс. руб. в месяц являются уже существенным выигрышем. 25  Принятие на работу всего 150 человек приводит тоже к близкому финансовому результату. Этот случай может быть рассмотрен как вариант расширения предприятия, если есть перспектива поиска лучшего варианта сбыта продукции. Графическая интерпретация решения. Построим на одном графике все три функции, описываемые уравнениями (4), (5), (6) (см рис. 1). Рис. 1. Графики зависимости экономических показателей от количества рабочих Из графика видно, что оптимум прибыли достигается примерно при 100 рабочих. График прибыли ведет себя достаточно плавно в окрестности максимального значения, значит небольшие изменения числа около рабочих 100 человек не сильно влияют на финансовый результат. Методика и специфика решения задач нелинейной оптимизации в MS Excel Задачу оптимизации нелинейной функции (6) можно было бы решить не путем анализа с использованием производной, и используя инструмент «Поиск решения» в MS Excel. Если реализовать вычисления функции (6) по значению переменной в ячейке (см. рис. 2), то можно определить оптимально значение переменной в этой ячейке. Рис. 2. Реализация вычисления функции прибыли в MS Excel 26 Для оптимизации используем инструмент «Поиск решения». Настраиваем параметры поиска решения (рис. 3) следующим образом: Рис. 3. Настройка инструмента «Поиск решения»  в поле «Оптимизировать целевую функцию» указываем ячейку, где реализована формула для прибыли;  в поле «До» указываем «Максимум»;  в поле «Изменяя ячейки переменных» указываем ячейку, предназначенную для значения переменной x ;  в поле «В соответствии с ограничениями» добавляем ограничение невозможности большого увольнения x  40 ;  состояние поля «Сделать переменные без ограничений неотрицательными» в нашей задаче безразлично, так как единственная переменная ограничена;  в поле «Выберите метод решения» выбираем «Поиск решения нелинейных задач методом ОПГ» (так как наша задача нелинейная). Нажав кнопку «Найти решение» получаем форму «Результаты поиска решения» (рис. 4). Убедившись, что в этом окне написано «Решение найдено. Все ограничения и условия выполнены», выбираем «Сохранить найденное решение» и нажимаем кнопку «Ок». 27 Рис. 4. Форма «Результаты поиска решения» В ячейке переменной получаем оптимальное решение (рис. 5). Рис. 5. Значения переменных после оптимизации Как видим, нам удалось найти правильное решение автоматически. Замечание: небольшое отличие значения в ячейке для искомой переменной от точного (получилось x  100,0000003 вместо x  100 ) обусловлено численной реализацией метода поиска. Это значение можно смело округлить с заданной точностью. Важно отметить такую специфику решения нелинейных задач в MS Excel. Поиск решения методом ОПГ ищет значения переменных от начального заданного, обеспечивая постоянное улучшение результата с текущего места. Такая реализация приводит к поиску локального, а не глобального экстремума. Так, «начав» поиск от 70 рабочих мы нашли оптимальное значение 100 человек. Начав же, например, со 160 человек, получим «оптимальное» количество 150 (рис. 6). Выбрав же вначале 200 человек можно снова прийти к оптимальному значению 100. Рис. 6. Изменение решения при смене начального приближения Описанное свойство является характерным для большинства алгоритмов численного поиска оптимумов в задачах нелинейной оптимизации. Для 28 того, чтобы получить действительно глобальный максимум необходимо попробовать определить оптимальное решение для нескольких начальных приближений (в задачах экономики они, как правило, выбираются легко из смысла задачи). В задачах с одной и двумя переменными очень помогает построение графиков. Примеры прикладных задач на основе задач нелинейной оптимизации. Модели управления запасами ОБЩИЕ СВЕДЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ УПРАВЛЕНИЯ ЗАПАСАМИ Математическое моделирование управления запасами используется для оценки оптимального запаса материальных ресурсов, предметов потребления, товаров различного вида и т. п. с целью удовлетворения спроса на некотором интервале времени. В любой задаче управления запасами требуется определять количество заказываемой продукции и сроки размещения заказа. Многие задачи, рассматриваемые в настоящем пособии, будут затрагивать создание запаса товаров в магазине. Однако запасы необходимы практически для любой организации. Это и запасы канцтоваров в офисе, и запасы деталей и заготовок на заводе, и запасы удобрений и ГСМ в сельскохозяйственном предприятии и т. д. Имеющийся спрос можно удовлетворить по-разному. Существует два крайних случая:  создать большой запас на весь предполагаемый период действия организации (на весь срок годности товара, на весь имеющийся объем склада и т. п.) и из этого запаса удовлетворять все поступающие заявки (крайне избыточный запас);  завозить товар по мере поступления заявки (полное отсутствие запаса). Достоинствами первого варианта является минимум затрат на оформление и доставку запасов, минимизация рисков дефицита, возможные скидки от объемов закупки. Недостатки первого варианта – большие капиталовложения в организацию хранения товара, риски порчи и устаревания товара. Второй способ имеет высокую себестоимость организации поставок и высокие риски дефицита, однако не требует больших затрат средств на хранение. В большинстве организационных и торговых систем организация поставок обоими крайними способами приводит к значительным затратам. Необходим некоторый промежуточный вариант, минимизирующий совокупные затраты. Заметим, что обычно объем спроса не зависит от организации поставок и определяется потребностями в товаре. В связи с этим суммарный объем поставок за интервал времени должен быть неизменным. В частности, если поставки 29 могут осуществляться только одинаковыми партиями размера Q , а число таких партий за интересующий интервал времени равно n , то их произведение постоянно: Q  n  Qсуммарное  const . Совокупные затраты системы управления запасами в самом общем случае можно выразить в виде следующей суммы: L  Lоф  Lпр  Lдост  Lхр  Lпот  Lдеф . где участвуют следующие составляющие:  Lоф – затраты на оформление заказа;  Lпр – затраты на приобретение заказа;  Lдост – затраты на доставку заказа;  Lхр – затраты на хранение заказа;  Lпот – затраты на потерю заказа (потери при порче товара или снижении его продажной цены);  Lдеф – затраты на дефицит (выплаты неустоек при отсутствии товара, потеря репутации, недополучение прибыли). Затраты на оформление заказа представляют собой расходы, связанные с его подбором и оформлением. Они обычно слабо зависят от размера заказа и во многих моделях принимаются постоянными. В этом случае, при организации поставок мелкими партиями затраты на оформление растут пропорционально количеству этих партий, а увеличение размера партии поставки соответственно снижает их. Затраты на приобретение определяются закупочной ценой на единицу товара. В случае неизменности цены в зависимости от объема поставки эти затраты за общую сумму заказов постоянны и не зависят от размеров партий. Ситуация заметно меняется, если используются скидки в зависимости от размера партии заказа (оптовые скидки). Затраты на доставку заказа могут быть постоянными для каждой партии (в случае, когда вся партия доставляется единым средством и не превышает его размеры) и пропорциональными размеру партии (когда доставляется большое количество товара и средства доставки пропорциональны размерам заказа). В первом случае эти затраты аналогичны затратам на оформление и растут пропорционально количеству партий заказа. Во втором случае имеем аналог затрат на приобретение, они не меняются в зависимости от количества партий и едины для неизменной общей суммы заказа. 30 Затраты на хранение запаса представляют собой расходы на организацию хранения (аренда или покупка помещений, зарплата складского персонала) и содержание запасов на складах (энергозатраты на холодильные и/или нагревательные установки и т. п.). В зависимости от системы хранения эти затраты могут быть пропорциональны размеру максимального количества запаса (при организации больших складских помещений) или пропорциональны произведению текущего количества запаса на время его хранения (при малых запасах). Затраты на потерю заказа или его части представляют собой потерю прибыли из-за порчи товаров, их устаревания или окончания срока годности. Затраты на дефицит складываются из сумм штрафных санкций, выплачиваемых предприятием при невозможности удовлетворения спроса, сумм недополученной прибыли из-за нехватки определенных ресурсов или падения репутации организации. Заметим, что в некоторых случаях определенные виды затрат бывают несущественными для моделирования или просто отсутствуют. Бывают случаи, когда некоторые затраты (например, дефицит или потери товара) невозможны или недопустимы по сути экономической или технологической постановки задачи. На рисунке 1 представлена типовая схематическая зависимость затрат каждого вида и суммарных затрат от размера партии заказа. По рисунку 1 видно, что при некотором оптимальном объеме партии заказа достигается минимум совокупных затрат Lmin . 31 Рис. 1. Типовой вид зависимости затрат от размеров партии В результате анализа мы должны дать ответ на два основных вопроса:  сколько ресурса заказывать?  когда заказывать? В качестве ответа на первый вопрос мы должны определить оптимальный размер заказа – количество ресурсов, которое необходимо поставлять каждый раз, когда происходит размещение заказа. В качестве ответа на второй вопрос мы должны определить оптимальную точку заказа – момент, когда необходимо производить заказ. В зависимости от системы управления запасами, точка заказа может определяться как временем (момент заказа), когда необходимо размещать заказ, так и количеством товара, оставшегося в системе (уровень запаса), при котором необходимо делать новую заявку. Обычно при осуществлении периодического контроля состояния запасов (раз в день, неделю, месяц и т. д.) необходимо обеспечивать поставку нового количества ресурсов в объеме размера заказа через равные интервалы времени, совпадающие с интервалами периодического контроля. Примером такой системы может служить организация запасов канцтоваров в офисе с ежемесячным или ежеквартальным сбором отчетов об использовании и заявок. При осуществлении непрерывного контроля состояния запаса необходимо размещать новый заказ в размере объема запаса, когда его уровень достигает точки заказа. МОДЕЛЬ УИЛСОНА Простейшей моделью управления запасами является Модель Уилсона. Эта модель достаточно хорошо описывает незначительные поставки продуктов первой необходимости (хлеб, молоко и т. п.), организацию запасов предметов обеспечения текущей деятельности организации (канцтовары, электротовары и т. п.), поставки запчастей для механизмов и расходных материалов и ряд других ситуаций. В модели Уилсона принимаются следующие допущения. 1. Имеется внешний неограниченный источник товара. Заказ доставляется от поставщика, у которого имеется неограниченное количество товара или со склада, на котором хранится ранее произведенный товар в достаточно больших количествах. Неограниченность товара необходимо понимать в рамках данной задачи следующим образом. Количество товара у поставщика или на складе должно быть таким, чтобы удовлетворить каждый раз любую требуемую 32 нами заявку. Например, для розничного магазина, закупающего по 5-10 коробок товара в день, достаточно, чтобы на складе постоянно находилось не менее 10 коробок товара. 2. Известна интенсивность потребления, и она не меняется с течением времени. Это справедливо, когда отсутствуют сезонные или недельные колебания спроса или ими можно пренебречь в рамках данной задачи. Рассмотрим, например, ситуацию с поставками и продажами пищевых продуктов длительного хранения (крупы, растительное масло и т. п.). Эти товары испытывают сезонные и недельные колебания спроса. Однако период их поставки обычно заметно больше недели, но меньше полугода. В этих условиях для оптимизации поставок мы можем рассматривать средненедельную интенсивность спроса, а оптимизировать поставки в течение каждого сезона в отдельности. 3. Время поставки заказа – известная постоянная величина. 4. Каждый заказ поставляется в виде одной партии. 5. Затраты на осуществление заказа не зависят от размера заказа. Считается, что оформление заявки и документов на получение заказа не зависит от его размеров. От размеров заказа в рамках данной постановки мы считаем независимой и стоимость доставки товара (это предположение, очевидно, справедливо для розничных и мелкооптовых партий товара, умещающихся в одной машине). 6. Затраты на хранение и потери запаса пропорциональны размеру хранимого запаса и времени хранения. Заметим, что случай пропорциональности части затрат максимальному количеству товара может быть сведен к описанному предположению. Как это сделать будет показано ниже. Так же будет описано, как в терминах «затрат на хранение» учесть фактор оборачиваемости денежных средств. 7. Недопустим дефицит товара, то есть товар всегда должен быть в наличии. Таким образом, в рамках этой модели справедливо:  Lоф  Lдост  K  n .  Lпр  C   T  const .  Lхр  Lпот  s  z  T .  Lдеф  0 . где K – затраты на оформление и доставку одной партии товара (руб.); n – количество партий товара за рассматриваемый интервал времени; C – цена за единицу товара (руб./ед. тов.);  – интенсивность (скорость) потребления запаса (ед. тов./ед. времени); 33 T – продолжительность рассматриваемого интервала времени (ед. времени); s – затраты на хранение единицы товара в единицу времени (руб./ед. тов. ед. времени.); z – среднее количество запасов (ед. тов.). Анализ модели Уилсона показывает, что оптимально поставлять товар одинаковыми партиями размера Q . Тогда за рассматриваемый интервал времени T будет поставлено товара Q  n . За этот же промежуток времени товар будет потреблен в количестве   T . Из условия недопустимости дефицита и нерациональности поставок, превышающих спрос следует условие: Q  n   T . Откуда  T . (5) n Q Заметим, что если мы имеем строго фиксированный промежуток времени T , то необходимо потребовать целочисленности числа поставок n . Однако обычно интервал T задает лишь характерное время анализа (например неделю, месяц и т. п.). В этом случае важна лишь частота поставок и число n может быть нецелочисленным (например 3,2 поставки в неделю означает, что необходимо осуществлять 16  3,2  5 поставок за 5 недель). Уровень запаса товара в данной модели представлен на рисунке 2. Уровень запаса – моменты получения заказов Размер партии заказа Средний уровень запаса Интервал между поставками Время Рис. 2. График циклов изменения запасов по модели Уилсона Тогда затраты за рассматриваемый интервал времени равны: Lоф  Lдост  sTQ K T ; Lхр  Lпот  ; Lпр  C   T , 2 Q 34 K T sTQ   C T . Q 2 Все величины, кроме объема партии Q , в этих формулах постоянны. Если потребовать минимума величины совокупных затрат: L  L  Q   min , L  Lоф  Lдост  Lхр  Lпот  Lпр  то из необходимого условия экстремума: dL K T sT  2   0, dQ 2 Q определяем объем оптимальной партии (формула Уилсона): 2K . (6) Qопт  s После этого определяем минимальные совокупные затраты за интервал времени: Lmin  T 2K s  C T . Так как оптимальный запас часто приходится округлять, то минимальные затраты лучше вычислять по общей формуле: K T sTQопт (7) Lmin    C T . Qопт 2 На рисунке 3 показаны типовые графики зависимости затрат от объемов поставки для модели Уилсона, полученные по приведенным выше формулам. 35 Рис. 3. Зависимость затрат от объема поставки в модели Уилсона По формуле (5) определяем оптимальное количество поставок за исследуемый интервал времени: nопт   T Qопт s T  2K , (8) оптимальную частоту заказов   n T : опт   Qопт  s , (9) 2K . s (10) 2K и интервал между поставками   T n :  опт  Qопт   Первые части формул (8) – (10) справедливы всегда, а вторые – только при точном выполнении соотношения (6) без округления. Если время выполнения и доставки заказа равно tд , то очевидно, необходимо подавать заказ за это время до требуемого момента получения заказа (рис. 4). Рис. 4. График циклов изменения запасов по модели Уилсона с учетом времени доставки При этом величина запаса в момент подачи заказа qзак (точка заказа) будет равна: qзак  tд  . 36 (11) МОДЕЛИРОВАНИЕ ЗАТРАТ ЗА МАКСИМАЛЬНЫЙ ОБЪЕМ И УЧЕТ СТОИМОСТИ ДЕНЕЖНЫХ СРЕДСТВ 1. Рассмотрим случай, когда затраты на хранение (или какая-то их часть) пропорциональны максимальному количеству товара на складе: Lхр1    Q  T . С учетом того, что z  Q 2 , можно записать: Lхр1    2  z  T . Сравним эту формулу с используемой выше: Lхр  Lпот  s  z  T . Очевидно, что при переобозначении: s  2  , формулы будут совпадать. Значит, в терминах модели Уилсона можно учесть и расходы на хранение товара, пропорциональные максимальному количеству товара на складе (например, арендную плату за склад). Надо лишь при проведении расчетов удвоить соответствующий коэффициент пропорциональности. 2. Если «вывод средств из оборота» существенен для организации, то это является дополнительным аргументом в пользу закупок товаров меньшими партиями. «Стоимость» выведенных средств может быть учтена так же за счет подправки коэффициента s . Например, пусть мы покупаем товары в кредит и вынуждены оплачивать кредит по процентной ставке i в единицу времени. Если кредит гасится по мере расходования запаса, то в среднем на складе находится z единиц товара купленных по C денежных единиц. Значит, за них нужно переплатить i  z  C  T денежных единиц. То есть, добавив к коэффициенту затрат на хранение s  i  C , мы учтем этот фактор. Если выплата по кредиту происходит один раз за поставку, то в этом случае нужно переплатить i  Q  C  T  i  2  z  C  T и для учета такой стоимости денег надо добавить к коэффициенту затрат на хранение s  2  i  C . МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ИСПОЛЬЗОВАНИЮ МОДЕЛИ УИЛСОНА На первом этапе из наблюдений за системой и статистических исследований, анализа документов, заявок и цен определяют входные параметры модели:  K – затраты на оформление и доставку одной партии товара;  C – закупочная цена за единицу товара;   – интенсивность потребления запаса;  s – затраты на хранение (и в том числе потери) единицы товара в единицу времени; 37  tд – время оформления и доставки заказа. Далее задаются интересующим интервалом времени T . Его желательно выбирать так, чтобы он включал в себя достаточно много интервалов краткосрочных изменений системы – суточных и недельных периодов изменения спроса, предполагаемых периодов поставки и т. п. Вместе с тем он должен быть заметно меньше длительных периодов колебаний состояния системы, таких как сезонные изменения. Все определенные выше параметры должны быть практически неизменны на выбранном интервале. На следующем этапе по модели Уилсона определяем выходные параметры: оптимальные параметры заказов и минимальные затраты на организацию управления запасами:  определяем оптимальный объем партии заказа Qопт по формуле (6), при необходимости округляем результат;  определяем оптимальное количество поставок nопт за интервал времени T , оптимальную частоту поставок опт и оптимальный интервал между поставками  опт по формулам (8), (9) и (10);  определяем точку заказа qзак – объем запаса, при котором необходимо делать следующий заказ по формуле (11);  определяем оптимальные совокупные затраты Lmin на организацию и хранение ресурса по формуле (7). Во всех формулах (8), (9), (10) первое выражение после равенства получается из общих подходов, а вторая – путем подстановки Qопт , определенного по формуле (7). Так как результат формулы (7) чаще всего округляется, то рекомендуется использовать общие выражения. Они же проще с точки зрения математических вычислений. ПРИМЕЧАНИЕ. Необходимо, чтобы все параметры задачи были согласованы по единицам измерения! Например, денежные единицы только в рублях или только в тысячах рублей и т. п. Все единицы времени – только в днях или только в неделях или только в месяцах и т. п. Все единицы измерения количества продукции – только в штуках или только в ящиках или только в тыс. шт. и т. п. 38 МОДЕЛИРОВАНИЕ СИСТЕМЫ УПРАВЛЕНИЯ ЗАПАСАМИ С «СОБСТВЕННЫМ» ПРОИЗВОДСТВОМ Модель Уилсона используется для моделирования процессов закупки продукции у внешнего поставщика. Если имеется возможность собственного производства продукции, то необходимо модифицировать описанную выше модель. В новой модели принимаются допущения во многом схожие с допущениями модели Уилсона: 1. Имеется собственный источник ресурса с известной интенсивностью производства  . Мы можем производить ресурс на собственном производстве или заказывать его производство. Скорость производства равна  единиц товара в единицу времени. Очевидно, что для удовлетворения спроса интенсивности  ед. товара/ед. времени необходимо выполнение условия:   . 2. Известна интенсивность потребления  , и она не меняется с течением времени. 3. Время переналадки оборудования на производство данного товара – известная постоянная величина tнал . 4. Каждый заказ производится в виде одной партии. 5. Затраты на осуществление заказа не зависят от размера заказа. В данном случае затраты на оформление заказа состоят прежде всего из стоимости перенастройки производства под выпуск данного товара, а также стоимости оформления документов и доставки товара от производства. Очевидно, что при незначительных объемах перевозок эти затраты не зависят от размера партии производимого товара. 6. Затраты на хранение и потери запаса пропорциональны размеру хранимого запаса и времени хранения. 7. Недопустим дефицит товара. В рамках этой модели справедливы аналогичные соотношения:  Lоф  Lдост  K  n .  Lпр  C   T  const .  Lхр  Lпот  s  z  T .  Lдеф  0 . 39 где K – затраты на переналадку производства, оформление и доставку одной партии товара (руб.); n – количество партий товара за рассматриваемый интервал времени; C – цена производства единицы товара (руб./ед. тов.);  – интенсивность (скорость) потребления запаса (ед. тов./ед. времени); T – продолжительность рассматриваемого интервала времени (ед. времени); s – затраты на хранение единицы товара в единицу времени (руб./ед. тов. ед. времени.); z – среднее количество запасов (ед. тов.). Заметим, что в этом, как и в предыдущем, случае суммарное количество произведенного товара, а, следовательно, и его суммарная стоимость производства определяются только имеющейся интенсивностью спроса и остаются постоянными, не зависящими от условий организаций поставок. Отличие этой модели от модели Уилсона заключается лишь в зависимости величины среднего запаса от параметров модели. Для ее определения рассмотрим изменение уровня запасов в этом случае (рис. 5). Рис. 5. График циклов изменения запасов при собственном производстве 40 В течение времени tпр продукция одновременно производится с интенсивностью  и потребляется с интенсивностью  . В результате происходит накопление запаса с интенсивностью      . За время tпр производится весь заказ: Q  tпр   , и накапливается максимальный уровень запаса: H  tпр       . Таким образом, максимальный уровень запаса и величина заказа связаны между собой зависимостью: H Q    Q  1     .  В течение времени tпотр продукция только потребляется, накопившийся запас расходуется с интенсивностью  . Средний уровень запасов при этом равен: z H Q   1     . 2 2 Тогда совокупные затраты за рассматриваемый интервал времени выражаются по следующей формуле: Lоф  Lдост  sTQ K T  1     ; Lпр  C   T , ; Lхр  Lпот  2 Q L  Lоф  Lдост  Lхр  Lпот  Lпр  K T sTQ   1      C T . Q 2 Данная зависимость с точностью до постоянного множителя 1     совпадает с формулой выражения затрат в модели Уилсона. Аналогично прошлому случаю получаем объем оптимальной партии: Qопт  2 K . s  1     Минимальные совокупные затраты за интервал времени: Lmin  T 2K s  1      C T , или в общем случае: L K T sTQопт   1     C T . Qопт 2 41 Оптимальное количество заказав за исследуемый интервал времени: nопт   s  1    T  T  , Qопт 2K оптимальную частоту заказов   n T : опт   Qопт   s  1    2K , и период запуска в производство   T n :  опт  Qопт   2K .  s  1    Введенные выше времена tпр и tпотр определяются по формулам: tпр       , tпотр  1       . Если время переналадки оборудования равно tнал , то очевидно, необходимо подавать заказ за это время до требуемого момента начала его выполнения. Если tнал  tпотр , то величина запаса в момент подачи заказа qзак (точка заказа) будет равна: qзак  tп  . Заметим, что ситуация tнал  tпотр приводит к тому, что прерывать производство данного товара становится нецелесообразным. В этом случае возможно снижение интенсивности его производства. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ИСПОЛЬЗОВАНИИ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С «СОБСТВЕННЫМ» ПРОИЗВОДСТВОМ Оптимизация данной системы управления запасами производится аналогично оптимизации системы, подчиняющейся модели Уилсона. Единственным дополнительным входным параметром является интенсивность производства  . МОДЕЛЬ УПРАВЛЕНИЯ ЗАПАСАМИ С УЧЕТОМ СКИДОК Как видно из анализа модели Уилсона, постоянная закупочная цена не влияет на оптимальный размер партии товара. Часто при закупках используются мелкооптовые и оптовые скидки – цена единицы товара меняется, если количество заказанного товара превышает некоторую величину. 42 В этом случае увеличение затрат на хранение большего объема партии заказа может быть компенсировано снижением затрат на закупку товара. Оптимальный размер заказа партии товара в случае поставок со скидками может отличаться от вычисленного по формуле (6). Модель управления запасами с учетом скидок предполагает следующие упрощения (многие из них повторяют упрощения модели Уилсона): 1. Имеется внешний неограниченный источник товара. 2. Известна интенсивность потребления  , и она не меняется с течением времени. 3. Время поставки заказа – известная постоянная величина. 4. Каждый заказ поставляется в виде одной партии. 5. Затраты на осуществление заказа не зависят от размера заказа. 6. Затраты на хранение и потери запаса пропорциональны размеру хранимого запаса и времени хранения. 7. Недопустим дефицит товара. 8. Закупочная цена на товар терпит разрывы. Цена единицы товара скачкообразно уменьшается при заданных количествах товара (рис. 6). Рис. 6. График зависимости закупочной цены в зависимости от размера приобретаемой партии с учетом скидок Таким образом, в рамках этой модели справедливо:  Lоф  Lдост  K  n .  Lпр  C  Q    T . 43  Lхр  Lпот  s  z  T .  Lдеф  0 . где K – затраты на оформление и доставку одной партии товара (руб.); n – количество партий товара за рассматриваемый интервал времени;  – интенсивность (скорость) потребления запаса (ед. тов./ед. времени); T – продолжительность рассматриваемого интервала времени (ед. времени); s – затраты на хранение единицы товара в единицу времени (руб./ед. тов. ед. времени.); z – среднее количество запасов (ед. тов.); C – цена за единицу товара (руб./ед. тов.), которая с учетом скидок выражается по формуле: C0 C 1   C  Q   C2  ...   Cn , при 0  Q  Q1, , при Q1  Q  Q2, , при Q2  Q  Q3, ... ... , при Qn  Q  . здесь: Q1 , Q2 , Q3 , , Qn – точки разрыва цен, C0 , C1 , C2 , C3 , , Cn – цена без скидки, цены с первой, второй и последующими скидками. ИССЛЕДОВАНИЕ МОДЕЛИ С ОДНОЙ СКИДКОЙ В случае единственной скидки цена на единицу товара зависит от его объема следующим образом: C , при 0  Q  Q1, C Q    0  C1 , при Q1  Q  . Будем называть объемом Уилсона величину Q объема заказа, вычисленную по формуле Уилсона (6), то есть: Q  2K . s Эта формула не включает в себя закупочную цену товара и, следовательно, Q едино для любой цены Ci . 44 При наличии только одной скидки возможны три качественно различных случая, изображенных на рис. 7 (а, б, в). 45 а) вид зависимости затрат в модели с учетом одной скидки при Q1  Q*  Qопт б) вид зависимости затрат в модели с учетом одной скидки при Q*  Q1  Qопт в) вид зависимости затрат в модели с учетом одной скидки при Q1  Q*  Qопт Рис. 7 (а, б, в). Зависимость затрат от объема партии товара в модели с одной скидкой 46 В случае, если точка разрыва цен Q1 меньше или равна объему Уилсона Q (рис. 7 (а)), то, очевидно, объем Уилсона является оптимальным: Qопт  Q , а минимальные затраты определяются ценой со скидкой C1 : K T sTQ Lmin     C1 T . 2 Q Все оптимальные параметры заказа необходимо находить по формулам (8) – (11). В случае, если точка разрыва цен Q1 больше объема Уилсона Q (рис. 7 (б, в)), то необходимо сравнить значение совокупных затрат L при объеме Уилсона, вычисленное по исходной цене C0 : K T sTQ L     C0 T 2 Q и значение совокупных затрат L1 при точке разрыва цен, вычисленное при цене со скидкой C1 :  L1  K T sTQ1   C1 T . Q1 2 (12) Если L  L1 (рис. 7 (б)), то: Qопт  Q1 , а для определения оптимальных параметров системы необходимо использовать следующие формулы: Lmin  L1 , nопт  T опт   опт  qзак Q1  Q1 Q1 , , ,   tд   . Если L  L1 (рис. 7 (в)), то: Qопт  Q , Lmin  L . Остальные оптимальные параметры системы определяются по формулам (8) – (11). 47 ИССЛЕДОВАНИЕ МОДЕЛИ С НЕСКОЛЬКИМИ СКИДКАМИ При исследовании модели с несколькими скидками производят анализ нескольких моделей с единственной скидкой. 1 Сначала определяют Qопт , и L1min – оптимальные параметры по модели 2 с первой скидкой относительно исходной цены, затем Qопт , и L2min – оптимальные параметры по модели со второй скидкой относительно исходной цены и n т. д. до параметров Qопт , и Lnmin , для n-ой скидки относительно исходной цены. Из всех найденных Limin выбирают самое наименьшее: LImin  min Limin . 1i n I Оптимальным объемом партии заказа будет Qопт  Qопт , а оптимальные параметры системы определятся по формулам: nопт  T , (13) , (14) , (15) qзак  tд  . (16) опт   опт  Qопт  Qопт Qопт  48 МЕТОДЫ ЛИНЕЙНОЙ ОПТИМИЗАЦИИ Задачи линейной оптимизации. Примеры прикладных задач линейной оптимизации Для задач этого класса предполагается, что целевая функция и все ограничения линейны. Таким образом, задача линейного программирования может быть записана следующим образом: n  ci  xi  min (max); i 1  n    aij x j  bi , i  1, 2,  , k ;  j 1  n   aij x j  bi , i  k  1,  , m; xi  0, i  1, 2,  , n.  j 1 (2.14) Первое уравнение системы (2.14) представляет собой линейную целевую функцию, минимум которой требуется найти, предполагая, что коэффициенты ci являются известными, заданными величинами. Второе и третье уравнения определяют допустимое множество решений. a Коэффициенты ij , входящие в эти уравнения и правые части уравнений bi , i  1, 2,, m , задающих ограничения, предполагаются известными экзогенными величинами. Допустимое множество решений может оказаться пустым. Тогда поставленная выше задача линейного программирования решения не имеет. Пустое множество допустимых решений может получиться в том случае, когда число уравнений, задающих ограничения, превышает число переменных задачи, т. е. когда m  n . Оптимальным решением, или оптимальным планом, называется вектор X  ( x1, x2 ,, xn ) , который удовлетворяет системе ограничений и реализует минимум целевой функции. Система уравнений (2.14) реализует так называемую общую постановку задачи линейного программирования. Всякая задача линейного программирования может быть приведена к канонической форме записи  n   ci  xi  min ;  i 1  n   aij x j  bi , bi  0, i  1, 2,, m;  j 1  xi  0, i  1, 2,, n;   (2.15) Сравнивая постановки задач линейного программирования (2.14) и (2.15), легко сформулировать правила перехода к канонической записи:  если в исходной записи требуется определить максимум целевой функции, то следует сменить знак целевой функции и искать минимум; 49  если в уравнении ограничения правая часть отрицательна, то следует умножить левую и правую части уравнения, задающего ограничение, на 1 ;  если среди ограничений имеются неравенства, то они путем введения новых неотрицательных переменных преобразуются в равенства. При этом в каждое неравенство достаточно добавить одну новую переменную. В принципе, может встретиться случай, когда одна или несколько переменных xk могут принимать только отрицательные значения. В этом случае следует ввести новые переменные xk   xk и сделать замену переменных как в целевой функции, так и в уравнениях ограничений. Пример 3.1 Банк, предоставляющий полный набор банковских услуг, находится в процессе формирования портфеля кредитов объемом 200 млн. руб. В таблице представлены возможные типы банковских кредитов. Тип кредита Нецелевые кредиты Автокредитование Ипотека Производственные Коммерческие Ставка кредита 0,16 0,14 0,10 0,12 0,11 Вероятность безнадежных долгов 0,10 0,07 0,03 0,05 0,04 Конкурентная борьба с другими финансовыми институтами вынуждает банк не более 30% капитала помещать в производственные и коммерческие кредиты. Для содействия строительной индустрии банк планирует вложить в кредиты на ипотеку не менее 40% от общей суммы нецелевых кредитов, кредитов на покупку автомобилей и жилья. Регулятор требует, чтобы максимально возможная доля безнадежных долгов в кредитном портфеле составляла не более 6%. Определить необходимые вложения средств банка для максимизации прибыли от предоставленных кредитов. Какие из ограничений оказались существенными? Как их изменения повлияют на прибыль банка? Решить задачу с помощью MS Excel. Выбрать и ввести необходимые настройки инструмента Поиск решения. Проанализировать и дать интерпретацию параметров отчета об устойчивости. Экономико-математическая модель Выберем переменные: x1 – сумма нецелевых кредитов; x2 – сумма на автокредитование; x3 – сумма кредитов на ипотеку; x4 – сумма производственных кредитов; 50 x5 – сумма коммерческих кредитов. Целевая функция. Так как банк оптимизирует прибыль, то целевая функция будет иметь вид: F   0,16  1  0,1  0,1  x1   0,14  1  0,07   0,07   x2    0,1  1  0,03  0,03  x3   0,12  1  0,05   0,05   x4    0,11  1  0,04   0,04   x5   0,044 x1  0,0602 x2  0,067 x3  0,064 x4  0,0656 x5  max Ограничения. Из общей суммы кредитов: x1  x2  x3  x4  x5  200 Производственные и коммерческие кредиты: x4  x5  0,3  x1  x2  x3  x4  x5  Ипотека: x3  0, 4  x1  x2  x3  Ограничение на невозвратные кредиты: 0,1x1  0,07 x2  0,03x3  0,05 x4  0,04 x5  0,06 x1  x2  x3  x4  x5 откуда получаем: 0,1x1  0,07 x2  0,03x3  0,05x4  0,04 x5  0,06  x1  x2  x3  x4  x5  . И все переменные, очевидно, должны быть неотрицательны. Приводя подобные, получаем задачу линейного программирования: F  0,044 x1  0,0602 x2  0,067 x3  0,064 x4  0,0656 x5  max  x1  x2  x3  x4  x5  200 0,3x  0,3x  0,3 x  0,7 x  0,7 x  0 1 2 3 4 5  0, 4 x1  0, 4 x2  0,6 x3  0 0,04 x  0,01x  0,03x  0,01x  0,02 x  0 1 2 3 4 5   x1  0, x2  0, x3  0, x4  0, x5  0 Пример 3.2 Следующую задачу линейного программирования привести к канонической форме 2  x1  x2  x3  max; 2  x2  x3  5; x1  x2  x3  1; 2  x1  x2  3; x1  0, x2  0, x3  0. (2.16) Решение 51 Поскольку переменная x1 x1   x1  0 . определена на отрицательной полуоси, введем новую переменную В задаче требуется найти максимум целевой функции. Поэтому поменяем знак у целевой функции, и будем искать минимум этой новой функции. В итоге первое из уравнений (2.16) запишется в виде 2  x1  x2  x3  min . Во втором уравнении добавим новую положительно определенную переменную x4 и запишем уравнение в виде 2  x2  x3  x4  5 . В третьем уравнении отрицательна правая часть. Поэтому сначала умно жим левую и правую части уравнения на 1 , произведем замену x1   x1 и добавим переменную x5 . В итоге третье уравнение запишется в виде x1  x2  x3  x5  1 . Аналогично производится и преобразование четвертого уравнения системы (2.16). Собирая все результаты вместе, получаем каноническую запись задачи линейного программирования (2.16): 2  x1  x2  x3  min; 2  x2  x3  x4  5; x   x  x  x  1; 1 2 3 5 2  x1  x2  x6  3; x1  0, xi  0, i  2, 3, 4, 5, 6. Заметим, что знак, с которым вводится новая переменная в уравнение ограничения, зависит от смысла неравенства. Если знак неравенства  , то дополнительная переменная вводится со знаком «плюс», а, если  , то со знаком «минус». Именно по этой причине перед переменной x6 поставлен знак минус. Смысл перехода к канонической форме записи в задачах линейного программирования состоит в том, что, развивая теорию решения задач оптимизации, можно ограничиться канонической формой записи, не рассматривая другие возможные постановки. Важно подчеркнуть также, что задача линейного программирования в канонической форме, а, следовательно, и любая задача линейного программирования могут быть решены введением неопределенных множителей Лагранжа. Построение экономико-математических моделей линейных задач. Методы решения задач линейного программирования. Решение задач линейной оптимизации в MS Excel Графический способ решения задач линейного программирования целесообразно применять тогда, когда имеется всего лишь две переменных. В этом случае уравнения ограничений, если в них неравенства заменить равенствами, 52 представляют собой уравнения прямых линий, которые легко можно построить на листе бумаги или с помощью прикладных программ на экране монитора ПК. Основным достоинством графического метода является визуализация области допустимых решений. Если такая область построена, то задача поиска оптимального плана сводится к построению линии, вдоль которой значение целевой функции остается постоянным. Очевидно, что можно построить множество таких линий. Каждая соответствует определенному значению целевой функции. Для определения оптимального плана следует выбрать такую линию, которая имела хотя бы одну точку, принадлежащую допустимой области решений, и обеспечивала экстремальное значение целевой функции. Для иллюстрации сказанного выше обратимся к простому примеру. Пример 3.3 Планируется выпустить два вида продукции. Для производства единицы продукции первого вида требуется 2 кг сырья первого вида, 1 кг сырья второго вида. Для производства единицы продукции второго вида требуется 1 кг сырья первого вида, 1 кг сырья второго вида. Наличие сырья первого вида –10 кг; второго – 7 кг. Прибыль от реализации единицы продукции первого вида – 6 рублей; второго вида – 4 рубля. Разработать оптимальный план выпуска продукции, оптимизирующий прибыль. Решение Сформулируем математическую модель задачи. Обозначим число единиц продукции первого вида x1 второго – x2 . Тогда условие оптимизации прибыли x1  6  x2  4  max . Поскольку сырьевые ресурсы ограничены, то следует записать уравнение, задающее ограничение на использование сырья первого вида: x1  2  x2 1  10 , и уравнение, ограничивающее потребление сырья второго вида: x1 1  x2 1  7 . Очевидно, что исходя из смысла задачи величины x1  0, x2  0 . Таким образом, математическая модель задачи определения оптимального плана выпуска является типичной задачей линейного программирования: x1  6  x2  4  max; x1  2  x2 1  10; x1 1  x2 1  7; x1  0; x2  0. (2.17) Для геометрической интерпретации ограничений заменим неравенства – равенствами во втором, третьем и четвертом уравнениях системы (2.17). Тогда каждое условие можно записать в виде уравнения прямой линии. В результате получаем уравнения 53 x2  10  2  x1; x2  7  x1; x1  0, x2  0. (2.18) Построим эти линии в декартовой системе координат, выбрав за ось абсцисс переменную x1 , а за ось ординат – переменную x2 (см. рис. 11). a 10 x2 8 c 6 g 4 2 d 2 4 b 6 x1 8 Рис. 11. Графическое построение области допустимых планов и оптимального плана На рис. 11 уравнению x2  10  2  x1 соответствует прямая ab, уравнению x2  7  x1 – прямая cd. Условия x1  0 и x2  0 ограничивают область допустимых планов первым квадрантом. Таким образом, если учесть все ограничения изучаемой модели (2.17), то легко можно увидеть, что областью допустимых решений является заштрихованный многоугольник, ограниченный осями координат и линией cgb. Условие оптимизации прибыли x1  6  x2  4  max также запишем в виде уравнения прямой, придав целевой функции некоторое значение C : x2  C 4  1,5  x1 . В действительности это уравнение задает целое семейство параллельных линий, различающихся различным значением прибыли C . Из всего множества этих линий следует выбрать ту, которая имеет хотя бы одну общую точку с областью допустимых решений и соответствует при этом максимально возможному значению прибыли, задаваемому параметром C . На рис. 11 это линия, касающаяся области допустимых планов в угловой точке g. Таким образом, прибыль будет максимальной, если x1  3 , x2  4 . При этих значениях параметров производства достигается максимально возможная прибыль, равная 34. Подведем некоторые итоги геометрического анализа задачи линейной оптимизации в примере 3.3. Хотя мы рассмотрели всего лишь один частный пример, он позволяет сделать выводы, справедливые для любой задачи линейного программирования. Во-первых, ограничения задают область допустимых планов. Если эта область оказалась пустой (не содержит ни одной точки), то такая модель явля- 54 ется недопустимой. Недопустимая модель не может иметь оптимального решения. Такого рода модели могут возникнуть, если ограничения являются противоречивыми. Во-вторых, экстремальное значение (максимальное или минимальное) целевая функция достигает в угловых точках многогранника допустимой области решений. Это замечание остается справедливым и в том случае, когда число переменных модели больше трех. В этом случае речь идет о многограннике в гиперпространстве переменных модели. Как исключение возможна ситуация, когда оптимальное решение достигается не в угловой точке области допустимых решений, а на одной из сторон этой области. Например, если в условие примера 3.3 внести коррективы, считая, что прибыль от реализации единицы продукции первого вида – 4 рубля; второго вида – 2 рубля, то семейство линий постоянной прибыли будет иметь вид x2  C 2  2  x1 (семейство линий, параллельных линии ограничения ab). Очевидно, что оптимальная прибыль, равная 20, достигается теперь уже не в угловой точке g, на всем участке bg, который является одной из сторон многогранника, ограничивающих область допустимых планов. Такого рода ситуации требуют особо тщательного анализа, поскольку здесь имеется не одно, а в общем случае бесконечно большое семейство оптимальных планов. Другая проблема таких решений – их неустойчивость. Действительно, если в уравнении, определяющем семейство планов с равной прибылью, x2  C 2  2  x1 , коэффициент перед переменной x1 будет чуть-чуть меньше двух, то оптимальным снова окажется план, совпадающий с точкой g, а если этот коэффициент окажется чуть-чуть больше двух, то оптимальным окажется план, совпадающий с точкой b. Таким образом, оптимальные решения в этом частном случае оказываются крайне неустойчивыми относительно малых ошибок в определении параметров модели. В реальной практике управления производством ошибки в определении параметров модели неизбежны. По этой причине поиск оптимальных решений должен всегда сопровождаться исследованием их устойчивости относительно возможных ошибок в определении параметров. Мы вернемся к анализу устойчивости оптимизационных моделей чуть позже, после ознакомления с численными методами решения задач оптимизации. Рассмотрим еще один важный в практическом отношении вопрос. Всегда ли допустимая область должна быть ограниченной? Легко себе представить ситуацию, когда допустимая область является неограниченной, как на рис. 12, а оптимальное решение существует. 55 Линия планов с постоянной прибылью x2 5 4 3 2 1 1 2 3 4 5 x 1 Рис. 12. Оптимизация в модели с неограниченной допустимой областью (вправо область предполагается неограниченной) В то же самое время, если бы линия планов с постоянной прибылью имела отрицательный наклон к оси абсцисс, то модель не имела бы оптимального решения. Такая модель называется неограниченной. Таким образом, каждая задача линейного программирования принадлежит к одной из трех взаимоисключающих категорий. Задача имеет оптимальное решение. Оптимального решения нет, поскольку нет допустимых решений. Оптимального решения нет, поскольку модель является неограниченной. Численное решение задач линейного программирования Графический метод решения задач линейного программирования дает наглядную интерпретацию смысла оптимального решения, но этот метод пригоден тогда, когда в задаче имеется две, максимум – три переменные. Даже в случае трех переменных уже возникают непростые проблемы построения области допустимых планов в трехмерном пространстве. Метод неопределенных множителей Лагранжа не имеет каких-либо ограничений, но является весьма трудоемким в практической реализации. По этой причине большое значение для решения задач линейного программирования приобретают программы, реализующие численные алгоритмы поиска максимального или минимального значения целевой функции при наличии различного рода ограничений. Наиболее известной из них является программа Поиск решения электронных таблиц Excel, которая позволяет решать задачи линейного, нелинейного, целочисленного программирования и, что очень важно для прикладных задач, дает развернутый отчет по устойчивости оптимального плана. Здесь нет необходимости подробно рассматривать технику использования процедуры Поиск решения, поскольку в курсе информатики этой теме уделялось достаточно много места. Ограничимся некоторыми рекомендациями, которым следует строго следовать при решении практических задач, с 56 тем чтобы избежать неявных ошибок и иметь возможность получать легко интерпретируемый отчет по анализу чувствительности модели. 1. Сформулированная в словесной форме задача линейного программирования должна быть формализована и записана в виде математической модели, например в виде (2.14). 2. Следует уделить должное внимание оформлению табличной модели на листе электронных таблиц Excel. Правильное оформление табличной модели позволяет легко контролировать ввод данных в программу Поиск решения и обеспечивает информативный отчет по чувствительности модели. Рекомендации по такому оформлению приведены ниже в примере 3.4. 3. Все формулы, влияющие на целевую функцию или ограничения, должны быть линейными по переменным решения. 4. Хотя модель линейного программирования является частным случаем модели нелинейного программирования, для программы Поиск решения Excel это не так, поскольку для линейных и нелинейных задач в ней используются совершенно разные алгоритмы. В частности, если для задач линейной оптимизации используются алгоритмы нелинейной модели, то полученное решение может оказаться неверным, и уж совершенно точно, что неверным будет отчет по устойчивости модели. По этой причине на закладке Параметры всегда нужно правильно указывать тип модели оптимизации. 5. При задании левых и правых частей ограничений модели в диалоговом окне Добавление ограничений1, нужно ссылаться на ячейки рабочего листа, а не вводить формулы в левое окно или константы в правое окно непосредственно на этой форме. Рекомендуется подготовить необходимые формулы и константы предварительно на листе рабочей книги, а в диалоговом окне Добавление ограничений лишь указать на нужные ячейки (см. пример 3.4). После того как сформулированы некоторые общие принципы, рассмотрим применения программы Поиск решения для анализа типичной задачи линейного программирования, связанной с составлением смесей. Пример 3.4 При создании сплава для новой продукции компания Eastern Steel использует железную руду, получаемую с четырех различных шахт. Как показал анализ, чтобы получить сталь с заданными технологическими свойствами, нужно обеспечить содержание основных химических элементов А, В, С в исходном сырье 1 Это окно открывается после нажатия кнопки Добавить на основной форме процедуры Поиск решения. 57 Элемент Минимальное содержание, кг/т А 5 В 100 С 30 Руда с каждой шахты содержит все три элемента, но в разных количествах. Состав руды приведен в таблице ниже Шахта (содержание элементов, кг/т) Элемент 1 2 3 4 А 10 3 8 2 В 90 150 75 175 С 45 25 20 37 Задачей менеджеров компании является составление такой допустимой смеси, составленной из руды с различных шахт, чтобы в одной ее тонне содержалось минимальное количество необходимых химических элементов при минимальной стоимости использованного сырья. Стоимость одной тонны руды с различных шахт приведена в таблице ниже. Шахта Стоимость руды, долл. США 1 800 2 400 3 600 4 500 Решение Обозначим x1, x2, x3, x4 – долю руды с первой, второй, третьей и четвертой шахт в одной тонне смеси. Целевая функция, очевидно, представляет собой стоимость одной тонны смеси, которая должна быть минимальной. В наших обозначениях это условие может быть записано в виде: x1 800  x2  400  x3  600  x4  500  min . Для построения математической модели этой задачи следует к условию минимальности добавить ограничения по содержанию химических элементов А, В, С в одной тонне смеси, условие положительности переменных x1, x2, x3, x4 и условие баланса – x1  x2  x3  x4  1 . В итоге математическая модель задачи имеет вид 800  x1  400  x 2  600  x3  500  x 4  min 10  x1  3  x 2  8  x3  2  x 4  5; 90  x1  150  x 2  75  x3  175  x 4  100; 45  x1  25  x 2  20  x3  37  x 4  30; x1  x 2  x3  x 4  1; x1  0, x 2  0, x3  0, x 4  0. (2.19) Целевая функция и ограничения в этой модели линейные, следовательно, мы имеем дело с задачей линейного программирования. 58 Запишем условия задачи на листе рабочей книги электронных таблиц Excel (составим табличную модель). Как уже указывалось, правильная запись математической модели на рабочем листе Excel является совершенно необходимым элементом решения задач с помощью программы Поиск решения. Ниже на рис. 13 показан пример такого размещения исходных данных. Целевой является ячейка с адресом F4, для размещения переменных отведены ячейки B3:E3. На рисунке показан фрагмент листа Excel после успешного завершения работы программы Поиск решения, поэтому в этих ячейках находятся значения искомых параметров оптимальной смеси. Ячейки B4:E4 содержат экзогенные параметры – стоимость тонны руды различных месторождений. В ячейках F6:F9 записаны левые части ограничений системы (2.19), а соответствующие константы содержатся в ячейках H5:H9. Рис. 13. Построение табличной модели решения задачи в примере 3.4 На рис. 14. приведена та же табличная модель решения задачи с явным указанием формул, введенных в ячейки электронной таблицы. Рис. 14. Формулы, записанные в целевую ячейку и ячейки, содержащие левые части ограничений Ячейки B6:E8 содержат заданные значения содержания химических элементов А, В, С в руде, добытой в различных шахтах. Эти данные используются для записи левых частей ограничений. Ячейки G6:G9 содержат знаки (равенств и неравенств), соединяющие левые и правые части ограничений системы (2.19), что позволяет контролировать правильность ввода данных в диалоговом окне Добавление ограничений. Наконец, в ячейках I6:I9 записана разность левых и правых частей ограничений. После выполнения оптимизационных расчетов результат в этих 59 ячейках может не оказаться равным нулю. Это не является ошибкой, поскольку левые и правые части ограничений соединены знаком неравенств. Наличие ненулевых результатов в этих ячейках следует рассматривать как некоторый резерв, который при возможном изменении технологии производства позволит снизить производственные издержки. После того, как оптимальное решение найдено, программа Поиск решения размещает оптимальные параметры в тех ячейках, в которых первоначально (до запуска программы оптимизации) размещалось пробное решение, а в целевую ячейку записывается оптимальное значение целевой функции. В рассматриваемой задаче оптимальной будет смесь, одна тонна которой содержит 259 кг руды первой шахты, 704 кг второй шахты и 37 кг руды третьей шахты. Стоимость этой смеси составляет 511,11 долларов за тонну. Важно подчеркнуть, что пробное решение в случае линейной модели не обязательно должно быть одним из допустимых планов. Как правило, решение будет найдено (если оно существует) независимо от значений, взятых в качестве пробного решения (на случай нелинейных моделей этот вывод не распространяется). По результатам проведенного выше анализа можно сделать некоторые качественные выводы, которые помогут правильному созданию моделей линейного программирования и более точно определить некоторые важные понятия. 1. Оптимальное решение любой задачи линейного программирования не может находиться во внутренней точке допустимой области. Лимитирующее ограничение – это ограничение, на линии которого расположено оптимальное решение. Нелимитирующее ограничение – это ограничение, на линии которого нет оптимального решения. Из общих соображения ясно, что добавление ограничений приведет либо к ухудшению оптимального решения, либо оставит его неизменным. Удаление ограничений приведет к улучшению оптимального значения либо оставит его неизменным. Введениеудаление дополнительных переменных улучшит ухудшит оптимальное значение, или оставит его неизменным. Анализ чувствительности моделей линейного программирования Выше мы рассмотрели методы графического и численного решения задач линейного программирования. Теперь нас интересует вопрос, насколько чувствительно оптимальное решение к небольшим изменениям исходных данных. 60 Допустим, что мы нашли оптимальное решение для некоторого набора параметров модели. Что произойдет с оптимальным решением, если один из параметров, например, цена за тонну руды на одной из шахт в предыдущей задаче, изменится на несколько процентов? Если оптимальное решение и значение целевой функции при незначительном изменении параметров будут изменяться в широких пределах, то такое решение не может быть рекомендовано для использования в производстве из-за высокого уровня непредсказуемости конечных результатов. Анализ чувствительности модели линейного программирования является настолько важным, что никакая задача не может считаться решенной, если такой анализ не произведен. Программа Поиск решения электронных таблиц Excel позволяет автоматически на отдельном листе рабочей книги получить отчет по устойчивости модели. К сожалению, разделы справки в Excel по этому разделу крайне ограничены, что делает использование отчета по устойчивости без дополнительных пояснений просто невозможным. Сразу следует отметить, что анализ чувствительности по каждому из параметров производится в предположении, что все остальные параметры модели остаются постоянными. В экономике такой анализ называется анализом по предельным показателям. Знакомство с отчетом программы Поиск решения по устойчивости целесообразно продолжить, используя данные конкретного примера. Пример 3.5 Мебельная фирма производит два вида стульев «Мечта» и «Лада». Компании требуется оптимизировать план недельного производства стульев, исходя из того, что прибыль от продажи одного стула «Мечта» составляет 56 рублей, а от продажи одного стула «Лада» – 40 рублей. Для сборки стульев нужны длинные и короткие штифты, ножки и одно из двух типов сидений. Недельный запас этих изделий на складе ограничен. Данные о потребностях деталей каждого вида для сборки одного стула и запас деталей на складе приведен в таблице. Расход на один стул Общий Наименование детали «Мечта» «Лада» запас Длинные штифты Короткие штифты Ножки Прочные сиденья Облегченные сиденья 8 4 4 1 4 12 4 1 1350 1600 760 140 120 61 Профсоюзы настояли на том, чтобы в трудовом договоре было записано условие, согласно которому недельный объем производства не может быть менее 100 стульев. Перед менеджерами компании стоит задача определить оптимальный план недельного производства стульев каждого типа. Решение Составим математическую модель задачи. Обозначим количество производимых стульев марки «Мечта» и «Лада» переменными x1 и x2 . Тогда математическая модель поставленной задачи будет выглядеть следующим образом: 56  x1  40  x 2  max; 8  x1  4  x 2  1350 (ограничен ие на число длинных штифтов); 4  x1  12  x 2  1600 (ограничен ие на число коротких щтифтов); 4  x1  4  x 2  760 (ограничен ие на число ножек); x1  140 (ограничен ие на число прочных сидений); x 2  120 (ограничен ие на число облегченны х сидений); x1  x 2  100 (минимальн ый объем производст ва); x1  0, x 2  0 (условие неотрицате льности). (2.20) Табличная модель решения задачи (после завершения работы программы Поиск решения) представлена на рис. 15. Рис. 15. Фрагмент листа рабочей книги Excel с табличной моделью решения задачи по оптимизации производства стульев Анализ устойчивости решения. Экономическая интерпретация решения задачи линейной оптимизации. Экономико-математический анализ полученных оптимальных решений и отчета об устойчивости Используя данные примера 3.5. рассмотрим, какую информацию можно получить об устойчивости модели в программе Поиск решения. Предположим, что доход от реализации стульев в течение недели может изменяться, а все ограничения остаются неизменными. В каких пределах может изменяться прибыльность производства стульев различных марок, которая не повлечет за собой замены плана производства? 62 При рассмотрении графического метода решения задач линейного программирования было показано, что коэффициенты при переменных в целевой функции изменяют угол наклона прямой, задающей постоянное значение целевой функции. На рис. 16 показана область допустимых планов для рассматриваемой задачи (закрашена серым цветом) x2 в 140 а 120 б 100 Р 80 60 40 20 20 40 60 80 100 120 140 160 x1 Рис. 16. Область допустимых решений для модели оптимизации производства. Пунктирной линией изображена линия целевой функции Из рисунка видно, что оптимальное решение находится в угловой точке допустимой области (точка пересечения прямых а и б). Ясно, что оптимальное решение не изменится, пока коэффициенты при x1 и x2 (удельные прибыльности производства одного стула разных марок) не поменяются настолько сильно, что оптимальное решение будет определяться другой угловой точкой. Отчет по устойчивости модели содержит эту информацию. На рис. 17 показан отчет по устойчивости, который выдает программа Поиск решения для задачи примера 3.5. Информация о допустимом изменении целевых коэффициентов приведена в первой и второй строках отчета. Рассмотрим подробно интерпретацию допустимых изменений целевого коэффициента при переменной x1 . Из отчета следует, что даже если удельная прибыльность производства стульев «Мечта» 30 будет очень большой величиной (1Е+30, т. е. 10 , что для Excel является синонимом бесконечно большой величины), то оптимальное решение не изменится. 63 Рис. 17. Отчет по устойчивости для задачи оптимизации производства стульев Понять причину этого, на первый взгляд странного, результата можно, проанализировав геометрический смысл решения (см. рис. 16). При бесконечно большой величине целевого коэффициента линия целевой функции станет вертикальной (прямая б на рис. 16). Естественно, что значение целевой функции изменится, а оптимальное решение – нет (считаем, что целевой коэффициент очень велик, но не бесконечен). Если прибыль от продажи одного стула «Мечта» уменьшится на 16 рублей, то уравнение целевой функции совпадет с одной из линий ограничения (линия в на рис. 16), и при дальнейшем уменьшении этого коэффициента оптимальным станет другое угловое решение, (точка Р на рис. 16). Итак, значения Допустимое увеличение и Допустимое уменьшение в таблице Изменяемые ячейки отчета по устойчивости показывают, насколько можно изменить целевой коэффициент при заданной переменной в целевой функции, оставив неизменными остальные параметры модели, чтобы при повторной процедуре минимизации получить то же самое решение. Если целевой коэффициент увеличить или уменьшить точно на допустимую величину, то появится альтернативное оптимальное решение (множество оптимальных решений). Рассмотрим еще одну возможную ситуацию, когда в отчете по устойчивости допустимое увеличение или допустимое уменьшение целевого коэффициента равно нулю. Исходя из графической интерпретации оптимального решения в задаче линейного программирования (см. рис. 16), легко догадаться, что такая ситуация будет возникать всегда, когда линия целевой функции параллельна линии ограничения. В этом случае даже при небольшом изменении целевого коэффициента эти линии перестанут быть параллельными, и вместо множества альтернативных решений появится одно единственное решение. Перейдем к рассмотрению того, как отражается на результатах оптимизации изменение правых частей ограничений. Как следует из графического анализа, изменение правых частей ограничений изменяет область допустимых планов. В частности, если левая и правая 64 части ограничения соединены знаком  , то при увеличении правой части ограничения область допустимых планов будет увеличиваться или останется неизменной, а при уменьшении – будет уменьшаться либо останется неизменной. Как отразится такое изменение допустимой области на значении целевой функции? Ясно, что увеличение области допустимых планов может привести к возрастанию целевой функции, а в случае, когда ограничения становятся жестче, целевая функция либо уменьшится, либо останется неизменной. Для менеджера, который намерен использовать модель на практике, важно знать, в каких пределах может изменяться правая часть ограничения, не изменяя значения целевой функции. Ответ на этот вопрос дают столбцы Теневая цена, Допустимое увеличение и Допустимое уменьшение таблицы Ограничения отчета по устойчивости. Теневая цена ограничения показывает, насколько изменится оптимальное значение целевой функции, если правую часть данного ограничения увеличить на одну единицу при условии, что остальные данные останутся без изменения. Термин цена используется здесь потому, что данная величина представляет собой максимальную цену, которую можно заплатить за приобретения дополнительной единицы ресурса. Теневую цену ограничения можно рассматривать как приращение целевой функции при увеличении правой части ресурсного ограничения на единицу. В экономике теневую цену иногда называют ценой резервирования. Диапазон значений правой части ограничения, для которого теневая цена остается постоянной, называется допустимым. Этот диапазон приводится в таблице Ограничения отчета по устойчивости в столбцах Допустимое увеличение и Допустимое уменьшение. Вне этого диапазона теневая цена может принимать другое значение. Теневая цена нелимитирующего ограничения всегда равна нулю (нелимитирующее ограничение означает, что в точке оптимальности данное ограничение имеет ненулевой резерв). В рассмотренном примере 3.5 нелимитирующими являются ограничения на число длинных, коротких штифтов и облегченных сидений. Поэтому и теневая цена для этих ограничений равна нулю. Следует отметить, что отчет по устойчивости – это обычный лист рабочей книги, и поэтому следует проверять формат представления числовых данных в ячейках, где выводится теневая цена, особенно в тех случаях, когда теневая цена может оказаться существенно меньше единицы. По умолчанию эти ячейки имеют тот же формат, что и ячейки, в которых записаны левые части ограничений в табличной модели. Отчет по устойчивости не содержит информации о том, как меняется оптимальный план при изменении правых частей ограничений. 65 Наконец, обратимся к информации, которая размещается в столбце Нормированная стоимость отчета по устойчивости. Нормированная стоимость переменной определяется как величина, на которую нужно изменить коэффициент целевой функции при переменной, чтобы оптимальное значение этой переменной стало положительным. Таким образом, если оптимальное решение для некоторой переменной является положительной величиной, то нормированная стоимость для нее равна нулю. В примере 3.5 оптимальные значения переменных – положительные величины, поэтому для них значения нормированной стоимости равны нулю. Для того чтобы лучше понять, как может быть использована информация, содержащаяся в отчете по устойчивости, рассмотрим еще один пример. Пример 3.6 Вернемся к задаче, условие которой сформулировано в примере 3.4. Руководство компании, изучив рекомендации по составлению оптимальной смеси (см. рис. 13), предложило менеджеру выяснить, как следует изменить технологию производства стали, чтобы цена тонны рудной смеси была ниже 500 долларов, в каком случае будет использоваться руда четвертой шахты? Решение Для ответа на оба вопроса требуется отчет по устойчивости модели, который приведен на рис. 18. Рис. 18. Отчет по устойчивости в задаче о составлении рудной смеси Для ответа на первый вопрос обратимся к столбцу Теневая цена. Поставленной цели – снижения стоимости рудной смеси до 500 долларов за тонну, проще всего добиться, если снизить содержание химического элемента А в рудной смеси. Если вместо 5 кг на тонну, содержание химического элемента А будет 4,75 кг на тонну, то цена одной тонны сырья упадет на 44,44  0,25  11,11 и составит искомые 500 долларов за тонну. Изменять содержимое элемента В не имеет никакого смысла, поскольку теневая цена для этого ограничения равна нулю. Можно добиться поставленной цели и снижением содержания элемента С в смеси. Поскольку теневая цена для этого ограничения равна 4,44, то содержание в руде элемента С нужно будет снизить на 11,11 4,44  2,503 кг на тонну. 66 Для ответа на вопрос о том, в каком случае буде использована руда четвертой шахты, следует обратиться к столбцу Нормированная стоимость. Для первых трех переменных нормированная стоимость равна нулю, поскольку оптимальное значение этих переменных больше нуля. Переменная x4 в точке оптимальности имеет нулевое значение. Нормированная стоимость показывает, насколько нужно изменить коэффициент при этой переменной в целевой функции, чтобы получить для x4 ненулевое оптимальное решение. В данном случае нормированная стоимость совпадает с величиной допустимого уменьшения, которое, как это уже отмечалось выше, показывает, на сколько единиц нужно уменьшить коэффициент при переменной в целевой функции, чтобы оптимальное решение изменилось. Таким образом, ответ на вопрос состоит в том, что если стоимость тонны руды с шахты четыре упадет более чем на 91,111 доллара, то эту руду станет целесообразно использовать в производстве. Завершая рассмотрение смысла параметров в отчете по устойчивости, необходимо еще раз подчеркнуть, что все сказанное выше относится только к тому случаю, когда табличная модель составлена в соответствии с принципами, декларированными выше. В частности, правые части ограничений должны содержать только константы. Если в правых частях содержатся формулы, то теневые цены интерпретировать крайне затруднительно. Дело в том, что при фиксации правых частей ограничений (кроме одного, для которого вычисляется теневая цена) будут зафиксированы и все переменные, входящие в их определения. В этом случае теневая цена теряет свой исходный смысл. Каждому ограничению должны соответствовать своя строка или столбец в табличной модели. Невыполнение этого требования приводит к тому, что некоторые из теневых цен помещаются в столбец Нормированная стоимость. Вырожденные решения Для решения линейных задач оптимизации Поиск решения использует симплекс-метод, разработанный для моделей в канонической форме. Для приведения модели к нужному виду добавляются, если нужно, дополнительные внутренние переменные, которые называются переменными резерва и излишка. Переменные резерва и излишка не входят в определение целевой функции и, естественно, никак не должны влиять на оптимальное решение исходной задачи. Для задачи линейного программирования, содержащей в качестве ограничений только равенства, можно доказать очень важную теорему. Согласно этой теореме, в каждой угловой точке допустимой области количество положительных переменных, включая переменные резерва и излишка, не превышает числа уравнений ограничения. 67 Важно отметить, что в число уравнений ограничения не включаются ограничения на положительность переменных. Переменные резерва и излишка являются дополнительными, внутренними переменными, которые никак не проявляются в результатах выдачи программы Поиск решения. Тем не менее, на основании предыдущей теоремы можно сформулировать важный практический вывод: решение задачи линейного программирования, полученное с использованием программы Поиск решения, всегда содержит не более m положительных переменных, где m – число ограничений модели. Если решение, найденное программой Поиск решения, содержит менее чем m положительных переменных, то оно называется вырожденным. Вырожденное решение не означает для модели ничего плохого. Вырожденное решение находится в вырожденной угловой точке. Вырожденная угловая точка области допустимых решений возникает тогда, когда слишком много ограничений накладывается друг на друга. Для иллюстрации сказанного обратимся к задаче, которая обсуждалась в примере 3.3. Запишем математическую модель этой задачи (2.17), используя только равенства. В итоге получаем следующую задачу 6  x1  4  x2  max; 2  x1  x2  s1  10; x1  x2  s2  7; x1  0; x2  0. (2.17а) В выражении (2.17а) переменные и являются переменными резерва и излишка. Таким образом, в этой задаче имеется четыре переменных ( x1, x2 , s1, s2 ) и два ограничения. Область допустимых решений в этой задаче (см. рис. 11) образуется прямыми линиями с уравнениями x1  0 (ось ординат), x2  0 (ось абсцисс), 2  x1  x2  10 (прямая gb), x1  x2  7 (прямая cg). Отметим, что на прямой gb переменная s1  0 , а на прямой cg – переменная s2  0 . Оптимальное решение находится в точке g , для которой s1  0 , s2  0 , и число положительных переменных в решении совпадает с числом ограничений. Таким образом, оптимальное решение не вырождено. Для угловой точки b области допустимых планов (см. рис. 11) выполняются уравнения x2  0 , s1  0 , а значения x1  0 , s2  0 . Следовательно, и эта угловая точка является невырожденной. Аналогично легко доказать, что и другие угловые точки допустимой области в этой задаче являются невырожденными. Анализ того, находится оптимальное решение в вырожденной угловой точке или нет, нужно для корректной интерпретации отчета по устойчивости. s1 68 s2 Например, данное выше понятие нормированной стоимости справедливо только для невырожденных решений. В отчете по устойчивости модели о вырожденности оптимального решения свидетельствует, как правило, нулевое значений в одном из полей Допустимое увеличение или Допустимое уменьшение для некоторого ограничения. В 1982 г. Джордж Стиглер получил Нобелевскую премию в области экономики за «Плодотворные исследования промышленных структур, функционирование рынков, а также причин и следствий экономического регулирования». Любопытно, что начал он свою карьеру ученого с решения задачи составления оптимального рациона питания, которая аналогична задаче составления оптимальной смеси, рассмотренной нами выше. Транспортные задачи. Постановка и методы решения транспортных задач. Экономико-математический анализ полученных решений Рассмотрим несколько различных постановок задач управления производством, которые являются типичными задачами линейного программирования. Одной из наиболее известных является задача оптимизации перевозок, часто называемая также транспортной задачей. Пример 3.7 Промышленная компания выпускает передвижные дизельные электростанции. Дизельные моторы производятся в США, а сборочные заводы расположены в европейских городах – Лейпциге, Нанси, Льеже и Тилбурге. Моторы доставляются один раз в квартал морем в европейские морские порты Порт Количество моторов Амстердам (А) 500 Антверпен (В) 700 Гавр (С) 800 Итого 2000 Стоимость перевозки моторов на сборочные заводы определяется таблиa цей (матрицей ij , i  A, B, C , j  1, 2, 3, 4 ) (приведена стоимость перевозки одного мотора в долларах за штуку). Место назначения Пункт отЛейпциг Нанси (2) Льеж (3) Тилбург правки (1) (4) Амстердам 120 (А) 130 41 59,5 69 Антверпен 61 40 100 110 (В) Гавр (С) 102,5 90 122 42 Квартальный спрос на моторы в местах сборки электростанций составляет Сборочный завод Квартальный спрос Лейпциг (1) Нанси (2) Льеж (3) Тилбург (4) 400 900 200 500 Итого 2000 Задачей менеджера компании является составление плана перевозок, обеспечивающего спрос сборочных предприятий, при минимальных суммарных затратах на перевозку. Решение Используя текст предложенной задачи, обсудим различные варианты постановки и решения транспортных задач. Во-первых, следует обратить внимание на то, что модель является сбалансированной, т. е. суммарное предложение моторов равно их конечному спросу. Этот вариант транспортной задачи является самым простым. x Для решения транспортной задачи нужно ввести переменные ij , которые определяют число моторов, перевозимых из порта i (i  A, B, C) на сборочный завод j ( j  1, 2, 3, 4) . В рассматриваемом случае таких переменных будет 12. Целевая функция представляет собой суммарную стоимость перевозки x всех грузов и равна сумме произведений числа моторов ij , перевозимых из a порта i на сборочный завод j , на стоимость этой перевозки ij :  xij aij  min i, j . (2.21) Условия ограничений модели представляют собой уравнения баланса для пунктов отгрузки моторов и пунктов назначения. 1. Количество моторов, отправленных из любого порта на все предприятия, не может превышать количество моторов Ai , имеющихся в данном порту: 4  xij  Ai , i  A, B, C. j 1 (2.22) 2. Количество моторов, доставленных на сборочный завод B быть не менее спроса j :  xij  B j , j  1, 2, 3, 4. i  A, B,C (2.23) 70 j , должно Для дальнейшего решения задачи математическая модель (2.21)–(2.23) должна быть преобразована на рабочем листе Excel в табличную модель (см. рис. 19). Рис. 19. Табличная модель транспортной задачи примера 3.7 после выполнения процедуры оптимизации Поскольку задача линейная, программа Поиск решения найдет оптимальные значения объемов перевозки независимо от того, какие значения переменных были выбраны в качестве начальных. Обычно модели линейного программирования не имеют целочисленного решения, невзирая на то, что все целевые коэффициенты и правые части ограничений являются целыми числами. Исключение составляют транспортные модели, для которых Поиск решения дает, как правило, целочисленные оптимальные решения. Используя условия примера 3.7 рассмотрим другие возможные постановки транспортной задачи. Если модель не является сбалансированной и суммарное предложение больше, нежели спрос, то никаких проблем не возникает, поскольку в условиях ограничений (2.22) используются неравенства. Если предложение меньше спроса, то задача не имеет допустимого множества решений. В этих условиях все же может быть поставлена задача максимального (но не полного) удовлетворения спроса при минимальных затратах. Возможны два подхода при моделировании такой ситуации. Первый подход состоит в том, что уравнение ограничений в портах следует записать в виде равенств, заставив Поиск решения использовать все имеющиеся ресурсы: 4  xij  Ai , i  A, B, C , j 1 а все ограничения для предприятий в местах сборки записать, используя неравенство  : 71  xij i  A, B,C  Bj, j  1, 2, 3, 4. Неудовлетворенный спрос в решении будет представлен «резервом» B (разностью между спросом j и реальным объемом поставок). Второй подход состоит в том, чтобы добавить фиктивный отправной пункт, запас в котором точно равен разности между общим спросом и предложением. Этот прием позволяет сделать модель сбалансированной. Для того чтобы результаты оптимизации имели практический смысл, затраты на перевозку из фиктивного пункта отправки в любые места назначения должны быть равны нулю. Каждая поставка из фиктивного пункта отправки на любой сборочный завод будет интерпретироваться как неудовлетворенный спрос. Может оказаться, что те или иные пути перевозки оказываются недопустимыми из-за стихийных бедствий, катастроф, забастовок и т. д.. В этом случае мы будем иметь модель с недопустимыми путями. Пусть, например, путь из Амстердама в Тилбург временно закрыт из-за аномального разлива реки Маас. Учесть недопустимость некоторых путей в транспортной модели проще всего, задав произвольно высокую стоимость перевозки между пунктами с недопустимыми путями. Это заставит Поиск решения отказаться от заблокированного пути. Многоцелевая оптимизация в транспортных задачах Очень часто в отчете по устойчивости транспортных задач возникают ситуации, когда допустимые изменения целевых коэффициентов для некоторых переменных равны нулю (рассматриваемая выше задача как раз относится к этому классу). Мы уже неоднократно отмечали, что для невырожденных задач это является свидетельством того, что существуют альтернативные решения (альтернативные значения оптимальных переменных), которые дают то же самое значение для целевой функции. В этих случаях возможна многоцелевая оптимизация. Например, в задаче примера 3.7 оптимальное значение целевой функции (суммарная стоимость всех перевозок) составляет 121 450 долларов, а стоимость перевозок моторов из Гавра составляет 67 400 долларов (см. рис. 19). Допустим, что отделение производственной компании в Гавре испытывает финансовые затруднения, и поэтому перед менеджером поставлена задача, не увеличивая общей стоимости перевозок, минимизировать стоимость перевозок из Гавра. Для решения этой задачи табличную модель на рис. 19 следует модифицировать. В качестве целевой ячейки теперь следует выбрать ячейку F25, в которой записана суммарная стоимость перевозок из порта Гавр. К ограничениям, которые были в исходной задаче, следует добавить еще одно: суммарная стоимость перевозок должна остаться неизменной. Поэтому в ячейку G26 72 нужно ввести число 121 450 и использовать ячейку F26 как левую часть ограничения, а ячейку G26 как правую часть ограничения, соединив их знаком равенства. В итоге будет получено другое решение задачи оптимизации, оставляющее неизменным значение полных затрат на перевозку при меньших (равных 49 250 долларах) затратах на перевозку из Гавра. Модель назначений Модель назначений часто встречается в задачах управления, где требуется, например, распределить мастеров-ремонтников по вызовам, продавщиц по отделам, аудиторов по фирмам и т. д. В качестве примера рассмотрим возможную постановку задачи назначения. Пример 3.8 Руководство фирмы, о которой шла речь в примере 3.7, приняло решение произвести инспекцию своих предприятий в Лейпциге, Нанси, Льеже и Тилбурге, направляя туда своих вице-президентов, каждый из которых в компании возглавляет одно из направлений (финансы, маркетинг, производство и персонал). Хотя может существовать большое число факторов, которые нужно учесть при таком назначении (знание языка, узкая специализация, отсутствие возможности оторваться от прямых обязанностей и т. д.), руководство компании решило оптимизировать в качестве первого шага только суммарные затраты на командировку вице-президентов. Таблица командировочных расходов в различные города (тыс. долларов) приведена ниже. Вице-президенты Лейпциг Нанси Льеж Тилбург По финансам 24 10 21 11 По маркетингу 14 22 10 15 По производству 15 17 20 19 По персоналу 11 19 14 Требуется составить схему распределения вице-президентов по филиалам, минимизирующую командировочные расходы. Решение На рис. 20 приведена табличная модель этой задачи о назначениях приведена после проведенной оптимизации. Модель назначений является разновидностью транспортной модели. От последней она отличается только тем, что в ней единица предложения не может распределяться по нескольким местам назначения (ср. рис. 19 и 20). Таким образом, модель назначений всегда можно построить в виде транспортной модели, в которой предложение в каждой исходной точке и спрос в каждом конечном пункте равны единице. 73 Точно так же, как и транспортная модель, модель назначений может быть несбалансированной, содержать недопустимые назначения, Рис. 20. Табличная модель задачи о назначениях примера 3.8 иметь альтернативные решения при одном и том же значении целевой функции. Эти варианты моделей назначения строятся в полной аналогии с соответствующими транспортными моделями. Модель оптимизации рекламной кампании С проблемой размещения рекламы в средствах массовой информации сталкиваются фирмы и рекламные агентства, перед которыми стоит задача увеличения сбыта рекламируемых товаров и услуг в стране или регионе. Как правило, вопрос заключается в том, какие средства массовой информации следует выбрать (радио, телевидение, газеты, журналы, Интернет, реклама на световых табло и т. д.), сколько рекламных блоков нужно дать в каждом из средств массовой информации. Ограничения, с которыми приходится считаться при принятии решения, могут быть связаны с величиной бюджетных средств, выделенных на рекламу, условиями рекламодателей (например, ограничение на число рекламных блоков). При размещении рекламы следует учитывать также и закон снижения отдачи от рекламы (при увеличении любого из ресурсов предельная эффективность является убывающей функцией). Хорошо известно, что десятый показ рекламного ролика оказывается менее эффективным, чем первый или второй показы. Для того чтобы оптимизировать рекламную кампанию, следует правильно выбрать целевую функцию. Естественно, что задачей рекламной кампании является стимулирование спроса на рекламируемый продукт. Заранее не известно, какая реклама и насколько увеличит спрос на рекламируемый продукт или услугу. По этой 74 причине должны быть заранее проведены дополнительные статистические исследования, позволяющие собрать нужную информацию. Обычно используется следующий подход: отдача от рекламы в определенных СМИ оценивается по специальной шкале в так называемых единицах воздействия (частный случай экономической функции полезности потребителя). Для дальнейшего знакомства с моделью рекламной кампании рассмотрим пример. Пример 3.9 Компания, производящая стиральный порошок, хочет выпустить на рынок новый продукт. На рекламную кампанию в первый месяц продвижения продукта на рынок выделено 72 000 долларов. Компания обратилась за помощью в рекламное агентство, которое предоставило следующие данные о воздействии рекламы на целевую аудиторию: Стоимость РазмеЧисло единиц одного рекламщение ре- товара, купленных ного объявления, кламы благодаря рекламе долл. Дневное радио 30 000 1 700 Вечер60 000 2 800 нее ТВ Еже45 000 1 200 дневная газета Рекламное агентство располагает информацией о снижении степени воздействии рекламы при ее многократном повторении. В частности, в агентстве считают, что на дневном радио эффективность первых 10 рекламных объявлений можно оценить 60 баллами, а всех последующих – 40 баллами. Таблица эффективности рекламных объявлений в различных СМИ приведена ниже. РазмещеПервые 10 Последуюние рекламы объявлений щие объявления Дневное 60 40 радио (1) Вечернее 80 55 ТВ (2) Ежеднев70 35 ная газета (3) Фирма-производитель стирального порошка сформулировала и некоторые дополнительные условия: а) в каждом СМИ должно быть размещено не 75 более 25 объявлений; б) общими усилиями всех СМИ объем продаж должен возрасти на 1 800 000 единиц товара; в) не мене четверти всех рекламных объявлений должно быть сделано на вечернем ТВ. Решение Сформулированная задача является типичной задачей линейного программирования. Для ее решения введем шесть переменных xi , yi , i  1, 2, 3 . Переменные xi описывают число рекламных объявлений на радио ( i  1 ), телевидении ( i  2 ) и в газете ( i  3 ), если их число не превышает 10, величины yi – число рекламных объявлений на радио ( i  1 ), телевидении ( i  2 ) и в газете ( i  3 ), если их число превышает 10. В этих обозначениях задача оптимизации рекламной кампании состоит в том, чтобы добиться максимума эффективности рекламных объявлений: 60  x1  40  y1  80  x2  55  y2  70  x3  35  y3  max . Ограничения на количество объявлений запишутся в виде x1  y1  25; x2  y2  25; x3  y3  25 , поскольку в каждом из СМИ не может появиться более 25 объявлений. Объем средств, затраченных на рекламную кампанию, подсчитать достаточно легко, поскольку известна стоимость одного объявления в различных СМИ. Выполняя подсчеты, получаем бюджетное ограничение 1 700  ( x1  y1)  2 800  ( x2  y2 )  1 200  ( x3  y3 )  72 000 . В соответствии с требованием заказчика число продаж в результате рекламной компании должно возрасти на 1 800 000 единиц. Поэтому имеем еще одно ограничение: 30 000  ( x1  y1)  60 000  ( x2  y2 )  45 000  ( x3  y3 )  1800 000 . Требование размещения не менее четверти рекламных объявлений на вечернем ТВ, приводит нас к ограничению x2  y2  0,25  ( x1  y1  x2  y2  x3  y3 ) . Количество рекламных объявлений должно быть целым числом. Поэтому при введении данных в программу Поиск решения нужно добавить еще и это ограничение. Следует помнить, что если переменные задачи являются целыми величинами, то программа Поиск решения Excel не генерирует отчет по устойчивости. Для решения задачи осталось составить табличную модель, ввести данные в программу и выполнить оптимизацию. В полном объеме задача будет рассмотрена на практических занятиях. 76 МНОГОКРИТЕРИАЛЬНАЯ ОПТИМИЗАЦИЯ Постановка задачи многокритериальной оптимизации Понятие многокритериальности Математические методы, описанные выше, преимущественно ориентированы на решение задач организационно-экономического содержания, в которых может быть обоснован и выбран один единственный критерий оптимизации. Спектр подобных задач достаточно широк. Наиболее адекватной областью их применения являются текущие задачи внутрифирменного управления. Однако при анализе крупномасштабных проблем, таких как задачи стратегического планирования развития фирм, задачи отраслевого, регионального уровня и т.п., затрагивающих разнообразные интересы участников планируемой операции, возникает необходимость оценки вариантов решений по нескольким критериям. Такого рода задачи называются многокритериальными. Примеров подобных задач можно приводить множество, но относительно обстоятельное описание примера займет много места именно в силу сложности существа многокритериальной задачи. Поэтому ограничимся лишь схематической иллюстрацией. Например, необходимо разработать программу реорганизации некоторого промышленного предприятия в целях повышения эффективности его деятельности. На словах формулировка цели реорганизации звучит весьма привлекательно, но это всего лишь лозунг – призыв к «светлому будущему». А что конкретно имеется в виду под эффективностью в данном случае? Под углом зрения какого критерия надо выбирать решение? С одной стороны, нам хотелось бы обратить в максимум валовой объем продукции V. Желательно также было бы получить максимальный чистый доход D. Что касается себестоимости S, то ее хотелось бы обратить в минимум, а производительность труда П – в максимум. При обдумывании задачи может возникнуть еще ряд дополнительных критериев. Такая множественность показателей эффективности (ряда количественных показателей F1, F2,…, из которых одни желательно обратить в максимум, а другие в минимум), называемая многокритериальностью, характерна для многих крупномасштабных задач исследования операций. Спрашивается, можно ли найти решение, одновременно удовлетворяющее всем этим требованиям? Со всей откровенностью ответим: в общем случае нет. Решение, обращающее в максимум один какой-то показатель, как правило, не обращает ни в максимум, ни в минимум другие. Поэтому, как уже отмечалось ранее, часто применяемая формулировка: «достигнуть максимального эффекта при минимальных затратах» представляет собой не более чем фразу и при научном анализе должна быть отброшена. 77 Как же быть в случае, если все же приходится оценивать эффективность операции по нескольким показателям? Люди, малоискушенные в исследовании операций, обычно торопятся свести многокритериальную задачу к однокритериальной: составляют некоторую комбинированную функцию от всех показателей и рассматривают ее как один, «обобщенный» показатель эффективности, по которому и оптимизируется решение. Часто такой обобщенный показатель имеет вид дроби, в числителе которой стоят все величины, увеличение которых желательно, а в знаменателе – те, увеличение которых нежелательно. Например, продуктивность и доход – в числителе, время выполнения и расходы – в знаменателе и т.п. Такой способ объединения нескольких показателей в один не может быть рекомендован, и вот почему: он основан на неявном допущении, что недостаток в одном показателе всегда может быть скомпенсирован за счет другого; например, малая продуктивность – за счет низкой стоимости и т.д. Это, как правило, несправедливо. Вспомним «критерий для оценки человека», полушутя полусерьезно предложенный когда-то Львом Толстым. Он имеет вид дроби, в числителе которой стоят действительные достоинства человека, а в знаменателе – его мнение о себе. С первого взгляда такой подход может показаться логичным. Но представим себе человека, имеющего незначительные достоинства, но совсем не обладающего самомнением. По критерию Л.И. Толстого такой человек должен иметь бесконечно большую ценность, с чем уж никак согласиться нельзя… К подобным парадоксальным выводам может привести (и нередко приводит) использование обобщенного показателя в виде дроби, где, как говорят, все, что «за здравие», – в числителе, все, что «за упокой», – в знаменателе. Нередко применяется и другой, чуть более замысловатый, способ составления обобщенного показателя эффективности – он представляет собой «взвешенную сумму» частных показателей, в которую каждый из них F i входит с некоторым «весом» аi, отражающим его важность: F = а1F1 + а2F2 +… (1) (для тех показателей, которые желательно увеличить, веса берутся положительными, уменьшить – отрицательными). При произвольном назначении весов а1, а2,… этот способ ничем не лучше предыдущего (разве тем, что обобщенный критерий не обращается в бесконечность). Его сторонники ссылаются на то, что и человек, принимая компромиссное решение, тоже мысленно взвешивает все «за» и «против», приписывая больший вес более важным для него факторам. Это, быть может, и так, но, по-видимому, «весовые коэффициенты», с которыми входят в расчет разные показатели, не постоянны, а меняются в зависимости от ситуации. 78 Поясним сказанное элементарным примером. Человек выходит из дому, чтобы ехать на работу, боится опоздать, и размышляет: каким транспортом воспользоваться? Трамвай ходит часто, но идет долго; автобус – быстрее, но с большими интервалами. Можно взять такси, но это дорого. Перед нами типичная (намеренно упрощенная) задача исследования операций с двумя критериями (показателями). Первый – среднее ожидаемое время опоздания Т, которое хотелось бы сделать минимальным. Второй – ожидаемая стоимость проезда S; ее тоже желательно сделать минимальной. Но эти два требования, как мы знаем, несовместимы, поэтому человек должен принять компромиссное, приемлемое по обоим критериям, решение. Возможно, он при этом подсознательно взвешивает все «за» и «против», пользуясь чем-то вроде обобщенного показателя: F = а1Т + а2S ⇒ min. (2) Но беда в том, что весовые коэффициенты а1, а2 никак нельзя считать постоянными. Они зависят как от самих величин Т и S, так и от обстановки. Например, если человек недавно уже получил выговор за опоздание, коэффициент при Т у него, вероятно, увеличится, а на другой день после получки, вероятно, уменьшится коэффициент при S. Если же назначать (как это обычно и делается) веса а1, а2 произвольно, то, по существу, столь же произвольным будет и вытекающее из них «оптимальное» решение. При произвольном назначении весов а1, а2,… этот способ ничем не лучше предыдущего (разве тем, что обобщенный критерий не обращается в бесконечность). Его сторонники ссылаются на то, что и человек, принимая компромиссное решение, тоже мысленно взвешивает все «за» и «против», приписывая больший вес более важным для него факторам. Это, быть может, и так, но, по-видимому, «весовые коэффициенты», с которыми входят в расчет разные показатели, не постоянны, а меняются в зависимости от ситуации. Поясним сказанное элементарным примером. Человек выходит из дому, чтобы ехать на работу, боится опоздать, и размышляет: каким транспортом воспользоваться? Трамвай ходит часто, но идет долго; автобус – быстрее, но с большими интервалами. Можно взять такси, но это дорого. Перед нами типичная (намеренно упрощенная) задача исследования операций с двумя критериями (показателями). Первый – среднее ожидаемое время опоздания Т, которое хотелось бы сделать минимальным. Второй – ожидаемая стоимость проезда S; ее тоже желательно сделать минимальной. Но эти два требования, как мы знаем, несовместимы, поэтому человек должен принять компромиссное, приемлемое по обоим критериям, решение. Возможно, он при этом подсознательно взвешивает все «за» и «против», пользуясь чем-то вроде обобщенного показателя: F = а1Т + а2S ⇒ min. (2) 79 Но беда в том, что весовые коэффициенты а1, а2 никак нельзя считать постоянными. Они зависят как от самих величин Т и S, так и от обстановки. Например, если человек недавно уже получил выговор за опоздание, коэффициент при Т у него, вероятно, увеличится, а на другой день после получки, вероятно, уменьшится коэффициент при S. Если же назначать (как это обычно и делается) веса а1, а2 произвольно, то, по существу, столь же произвольным будет и вытекающее из них «оптимальное» решение. Покажем, как это делается. Пусть имеется многокритериальная задача исследования операций с k критериями F1, F2,…, Fk. Для простоты предположим, что все эти величины желательно максимизировать. Пусть в составе множества возможных решений есть два решения х1, х2 такие, что значения всех критериев F1, F2,…, Fk для первого решения больше или равны соответствующим критериям для второго решения, причем хотя бы один из них действительно больше. Тогда из состава множества Х решение х2 вытесняется ( говорят «доминируется») решением х1. В результате такой процедуры отбрасывания заведомо невыгодных решений во множестве Х сохраняются только эффективные («оптимальные по Парето» или «паретовские») решения, характерные тем, что ни для одного из них не существует доминирующего решения. Доминирование и оптимальность по Парето Проиллюстрируем прием выделения паретовских решений на примере задачи с двумя критериями: F1 и F2 (оба требуется максимизировать). Множество Х состоит из конечного числа n возможных решений х1, х2,…, хn. Каждому решению соответствуют определенные значения показателей F1, F2; будем изображать решение точкой на плоскости с координатами F1, F2 и занумеруем точки соответственно номеру решения (рис. 8). 80 Очевидно, из всего множества Х эффективными (доминирующими) будут только решения х2, х5, х10, х11, лежащие на правой верхней границе области возможных решений (см. точки, соединенные пунктиром), причем х11 – наилучшее по критерию F1, х2 – по критерию F2. Дело лица, принимающего решение, выбрать тот вариант, который для него предпочтителен и «приемлем» по обоим критериям. Аналогично строится множество эффективных решений и в случае, когда показателей не два, а больше (при этом геометрическая интерпретация теряет наглядность, но суть дела сохраняется). Рассмотрим макроэкономическую модель Финляндии, построенную в 70-х годах. Качество решений оценивалось по четырем критериям: С! – увеличение валового национального продукта (в %); С2 – уменьшение инфляции (в %); С3 – уменьшение безработицы (в %); С4 – уменьшение дефицита внешней торговли (млрд. фин. марок). В табл.13 приведены три различных варианта экономической политики. Таблица 13. Зна- С! С2 С3 С4 чения критериев вариантов экономической политики Вариант решения 1 – 2,74 8,16 3,28 2,24 2 0,57 9,00 2,81 5,27 3 1,81 8,88 2,64 6,54 Наилучшие реше- 7,18 8,16 1,88 1,21 ния В нижней строке табл.13 приведены наилучшие значения каждого из критериев, которые можно получить, если оптимизировать по одному критерию, не обращая внимания на другие. Наилучшие значения по всем критериям одновременно не достижимы. Легко видеть, что приведенные альтернативы являются точками множества Парето в четырехмерном пространстве критериев. Действительно, первый вариант дает наименьшее значение инфляции и дефицита внешней торговли, но отрицательный прирост ВНП и большую безработицу. Третий вариант лучший по росту ВНД и уровню безработицы, но худший по дефициту внешней торговли. Эти противоречия отражают типичный характер вариантов многокритериальных решений. Множество эффективных решений легче обозримо, чем множество Х. Что касается окончательного выбора решения, то он по-прежнему остается прерога81 тивой человека. Только человек, с его непревзойденным умением решать неформальные задачи, принимать компромиссные решения (не строго-оптимальные, но приемлемые по ряду критериев) может взять на себя ответственность за окончательный выбор. Однако сама процедура выбора решения, будучи повторена неоднократно, может послужить основой для выработки некоторых формальных правил, применяемых уже без участия человека. Речь идет о так называемых «эвристических» методах выбора решений. Предположим, что опытный менеджер (или, еще лучше, их группа) многократно выбирает компромиссное решение в многокритериальной задаче исследования операций, решаемой при разных условиях α. Набирая статистику по результатам выбора, можно, например, разумным образом подобрать значения «весов» а1, а2,… в формуле (1), в общем случае зависящие от условий α и самих показателей F1, F2,…, и воспользоваться таким обобщенным критерием для выбора решения, на этот раз уже автоматического, без участия человека. На это иногда приходится идти в случаях, когда времени на обдумывание компромиссного решения нет (например, в условиях боевых действий), или же в случае, когда выбор решения передается автоматизированной системе управления. В некоторых случаях очень полезной оказывается процедура выбора решения в диалоговом (или интерактивном) режиме, когда компьютер, произведя расчеты, выдает лицу, управляющему операцией, значения показателей F1, F2,…, а это лицо, критически оценив ситуацию, вносит изменения в весовые коэффициенты (или иные параметры управляющего алгоритма) и расчеты повторяются. Методы решения задач многокритериальной оптимизации для структурированных проблем. Метод свертки. Метод пропорции. Метод идеальной точки. Метод приоритетов (главного критерия). Метод последовательных уступок Часто применяется на практике способ свести многокритериальную задачу к однокритериальной – это выделить один (главный) показатель F1 и стремиться его обратить в максимум, а на все остальные F2, F3,… наложить только некоторые ограничения, потребовав, чтобы они были не меньше каких-то заданных f2, f3,… Например, при оптимизации плана работы предприятия можно потребовать, чтобы прибыль была максимальной, план по ассортименту – выполнен или перевыполнен, а себестоимость продукции – не выше заданной. При таком подходе все показатели, кроме одного – главного (прибыль), переводятся в разряд заданных условий α. Некоторый произвол в назначении границ f2, f3,…, разумеется, при этом остается; поправки в эти границы тоже могут быть введены в диалоговом режиме. 82 Существует еще один путь построения компромиссного решения, который можно назвать методом последовательных уступок. Предположим, что показатели F1, F2,… расположены в порядке убывающей важности. Сначала ищется решение, обращающее в максимум первый (важнейший) показатель F1 = F1*. Затем назначается, исходя из практических соображений, с учетом той точности, с которой нам известны входные данные, некоторая «уступка» ΔF 1, которую мы согласны сделать для того, чтобы максимизировать второй показатель F2. Наложим на показатель F1 ограничение: он должен быть не меньше, чем F1* – ΔF1, и при этом ограничении ищем решение, обращающее в максимум F2. Далее снова назначаем «уступку» ΔF2, ценой которой можно максимизировать F3, и т.д. Такой способ построения компромиссного решения хорош тем, что здесь сразу видно, ценой какой «уступки» в одном показателе приобретается выигрыш в другом и какова цена этого выигрыша. Так или иначе, при любом способе ее постановки, задача обоснования решения по нескольким показателям остается не до конца формализованной, и окончательный выбор решения всегда определяется волевым актом лица, принимающего решения (ЛПР). Дело исследователя – предоставить в распоряжение ЛПР данные, помогающие ему сделать выбор не «вслепую», а с учетом преимуществ и недостатков каждого варианта решения. Можно рекомендовать еще метод идеальной точки, который состоит в отыскании среди паретовских решений ближайшего к точке утопии, задаваемой ЛПР. Формулируется цель в виде желаемых значений показателей, и часто выбирается сочетание наилучших значений всех критериев F1*, F2*,… (обычно эта точка не реализуется при заданных ограничениях, поэтому ее и называют точкой утопии). Лучшим считается решение х, обращающее в минимум сумму квадратов отклонений значений всех критериев Fi(х) от их наилучших значений F1*, F2*,… Для пояснения рассмотрим пример с пятью критериями: F1  x   max F2  x   max F3  x   max g1  x   min g 2  x   min Для метода взвешивания: веса критерия F1 равен vF 1 ; критерия F2 равен vF 2 ; критерия F3 равен vF 3 ; критерия g1 равен vg1 ; критерия g 2 равен vg 2 . 83 МЕТОД СУММЫ В этом методе из критериев формируется один общий максимизируемый критерий. В нем значения максимизируемых критериев складываются, а минимизируемых вычитаются: S  x   F1  x   F2  x   F3  x   g1  x   g 2  x   max МЕТОД ВЗВЕШИВАНИЯ КРИТЕРИЕВ (СВЕРТКИ) В этом методе из критериев формируется один общий максимизируемый критерий. В нем значения максимизируемых критериев умножаются на свои веса и складываются, а минимизируемых умножаются на веса и вычитаются: V  x   vF1  F1  x   vF 2  F2  x   vF 3  F3  x   vg1  g1  x   vg 2  g 2  x   max МЕТОД ПРОПОРЦИИ (ОТНОШЕНИЯ, ПРОПОРЦИОНАЛЬНОСТИ) В этом методе из критериев формируется один общий максимизируемый критерий. В нем значения максимизируемых критериев умножаются и делятся на произведение минимизируемых критериев: Px  F1  x   F2  x   F3  x  g1  x   g 2  x   max МЕТОД ИДЕАЛЬНОЙ ТОЧКИ (МИНИМАЛЬНОГО ОТЛИЧИЯ ОТ ИДЕАЛА) В этом методе из критериев формируется один общий минимизируемый критерий. Для этого сначала определяются наилучшие значения каждого из критериев вне зависимости от остальных (идеалы): F1  max F1  x  , F2  max F2  x  , F3  max F3  x  , g1  min g1  x  , g2  min g2  x  . Далее мини- мизируем сумму квадратов отклонений критериев от их идеалов:    F x  F     g x  g   g x  g  I  x   F1  x   F1   F3  x   F3 2  2 2 2 2 1  2 1 2  2 2  min Внимание: тут между скобками все знаки «+». МЕТОД ГЛАВНОГО КРИТЕРИЯ В этом методе оптимизируется только один из критериев – самый важный, «главный». Остальные критерии ограничиваются: максимизируемые ограничиваются снизу: «не меньше», а минимизируемые – сверху: «не больше». Ограничения выбираются из каких-либо обоснованных соображений. 84 Например, пусть для нашего примера самым главным критерием является F1 . Будем требовать максимизации F1 . Для остальных критериев есть обусловленные какими-либо условиями требования: F2 не может быть меньше некоторого значения F2 min ; F3 не может быть меньше некоторого значения F3min ; g1 не может быть больше некоторого значения g1max ; g 2 не может быть больше некоторого значения g 2 max . Тогда задача выбора решения, сформированная по методу главного критерия, запишется так: F1  max  F2  F2 min F  F  3 3min   g1  g1max  g 2  g 2 max МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ УСТУПОК В этом методе сначала оптимизируется самый важный критерий и определяется его самое наилучшее значение (идеал). На следующем шаге допускается некоторое фиксированное ухудшение от этого оптимального значения (уступка) с целью улучшения ситуации по второму по значимости критерию. Получается условный идеал второго критерия. Далее допускается уступка от него с целью оптимизации третьего критерия и так далее. При уступке для максимизируемого критерия, от его идеала отнимаем соответствующую уступку. При уступке для минимизируемого критерия – добавляем величину уступки. Уступки могут быть абсолютные (которые прибавляются к идеалу или вычитаются из него) или относительные (которые приводят к добавлению или вычитанию определенного количества процентов от соответствующего идеала). Например, пусть для нашего случая:  самый главный критерий это F1 ,  следующий по значимости F2 ,  потом g1 ,  потом g 2 ,  и наконец F3 . Из некоторых соображений установлены максимально допустимые уступки:  F1 – абсолютная уступка для F1 ; 85   F2 – относительная уступка для F2 ;   g1 – относительная уступка для g1 ;  g 2 – абсолютная уступка для g 2 ; для последнего критерия задавать уступку не надо. Тогда применение метода будет осуществляться в следующих шагах: 1) Оптимизируем F1  max . В результате определяем идеал F1 . 2) Оптимизируем F2  max при ограничении: F1  F1  F1 В результате определяем условный идеал F2 . Заметим, что условный идеал F2 чаще всего не совпадает с абсолютным идеалом F2 , так как условный идеал получен при дополнительном условии. 3) Оптимизируем g1  min при ограничениях:  F1  F1  F1    F2  F2  1   F2  В результате определяем условный идеал g1 . 4) Оптимизируем g2  min при ограничениях:  F1  F1  F1    F2  F2  1   F2     g1  g1  1   g1  В результате определяем условный идеал g 2 . 5) И на последнем шаге оптимизируем F3  max при ограничениях: 86  F1  F1  F1    F2  F2  1   F2     g1  g1  1   g1     g 2  g 2  g 2 Те значения x  , при которых достигается последнее оптимальное значение и являются решением задачи многокритериальной оптимизации по методу последовательных уступок. Обратите внимание на знаки неравенств и знаки перед уступками для максимизируемых и минимизируемых критериев. Методы многокритериального анализа альтернатив для слабоструктурированных проблем. Метод аналитической иерархии (Метод Саати) Одним из вариантов ситуации принятия решения является так называемая критериальная постановка. В этом случае лицо, принимающее решение (ЛПР), выбирает лучшие из альтернатив для достижения определенной цели. Но соответствие цели оценивается не непосредственно, а путем удовлетворения набору критериев, обладанием рядом свойств. Наиболее известными примерами выбора решений в рассмотренной постановке являются:  выбор автомобиля, мобильного телефона, мебели и т.п.;  выбор сотового оператора;  выбор места для отдыха;  выбор варианта инвестирования средств;  найм сотрудника;  выбор исполнителя работ. Невозможно назвать «лучший» автомобиль. Конечно, важнее всего, какую цель мы преследуем при его покупке. Но и в этом случае все неоднозначно, доказательством чему является огромное количество разных производимых и продаваемых автомобилей всех категорий. Например, «лучшего автомобиля для семейного пользования» нет – кроме характеристик, следующих непосредственно из цели использования (габариты, число мест и т.п.), имеются общие характеристики (экономичность, безопасность и т.п.), характеристики экономического характера (цена, доступность на рынке и т.п.), индивидуальные предпочтения (цвет, стиль и т.п.) и другие характеристики. В описанных ситуациях, как правило, можно выделить группу наиболее интересных альтернатив (подходящих по цене, удовлетворяющих большинству запросов и т.п.). Окончательный выбор из этой группы оказывается более 87 затруднительным. Если лицо, принимающее решение, – один человек, то можно понадеяться решить проблему волевым методом. Хотя не каждому удается сделать это быстро, уверенно и без лишних психологических потрясений (как не вспомнить печальный пример Буриданова осла ). В случае же коллективного принятия решения группой лиц ситуация еще больше осложняется (вспомните выбор семейного отдыха в семье Дяди Федора из произведений Э.Успенского). Для получения обоснованного «лучшего» решения применяют критериальные методы или методы критериального анализа иерархий. Для названных случаев гораздо проще сравнивать альтернативы между собой не с точки зрения достижения цели, а с точки зрения удовлетворения конкретным критериям (спорное сравнение автомобилей «какой лучше для семейных поездок» превращается в более простое сравнение по цене, комфорту, экономичности, цвету и т.п.). Кроме того, необходимо сравнить между собой значимость критериев для конкретной цели. Таким образом, возникает иерархичность – альтернативы обладают критериями, критерии определяют степень соответствия цели (рис. 1). Рис. 1. Иерархическая структура ситуации принятия решения Как правило, имеются два уровня иерархии. В некоторых случаях возникают более сложные иерархии, как правило, когда критерии являются сложными, комплексными. В 1970 г. Томас Саати (США) разработал метод анализа иерархий (Analityc hierarchy process). Кроме метода Саати существует множество других методов анализа подобных проблем. Однако именно этот метод получил широкое распространение и до сих пор активно используется в управленческой практике. 88 Критики метода приводят в качестве аргументов математическую неточность ряда моментов и возможность математических противоречий на этапах применения метода, отсутствие фильтрации противоречивых суждений. Однако это же является и достоинствами метода, ибо сам факт принятия решения, выбора «лучшего» и т.п. – часто противоречивая ситуация. Метод Саати приводит ЛПР не к «правильному» решению, а к варианту, наилучшим образом согласующемуся с его пониманием сути проблемы и требованиями к ее решению. Таким образом, этот метод позволяет получить объективные математические соотношения между альтернативами на основе субъективного взгляда на ситуацию лица, принимающего решение. МЕТОД СААТИ Основа метода Саати – попарные сравнения альтернатив по каждому из критериев и попарное сравнение критериев с точки зрения важности для поставленной цели. Таким образом, все сравнения в данном методе производятся попарно, – то есть самым простым и очевидным методом. Например, какой автомобиль комфортнее, «Мерседес» или «Запорожец»? Для сравнения Саати предложил использовать качественные признаки, переводимые потом в количественные по 9-ти балльной шкале (табл. 1). Таблица 1. Качественные варианты сравнения и соответствующие им количественные баллы Качественное сравнение равно, одинаково, безразлично немного лучше, важнее лучше, важнее значительно лучше, важнее принципиально лучше, важнее Количественный аналог 1 3 5 7 9 Качественное сравнение равно, одинаково, безразлично немного хуже, менее важнее хуже, менее важно значительно хуже, менее важно принципиально хуже, менее важно Количественный аналог 1 1/3 1/5 1/7 1/9 Третий и четвертый столбик таблицы 1 соответствуют первому и второму для смены сравниваемых объектов. Например, если «Запорожец» принципиально лучше по критерию цена, чем «Мерседес», то «Мерседес» принципиально хуже «Запорожца» по этому критерию. 89 В случае, если ЛПР не может определиться между двумя качественными признаками, наличии промежуточного мнения, Саати рекомендует использовать промежуточные баллы 2, 4, 6, 8. Определение указанных вариантов сравнения может быть осуществлено многими способами: по субъективному мнению, по экспертной оценке, путем голосования и др. Иногда используют метод построения матрицы сравнений на основе «среднего» мнения группы экспертов. В этом случае каждый эксперт дает свое сравнение. Из мнений экспертов по таблице 1 формируются числовые значения и из них берётся среднее арифметическое. При этом проводится сравнение только «в одну сторону». Обратное сравнение вычисляется, как и раньше, путем деления единицы на полученный результат. Заметим опять же субъективный подход в сравнении. Даже для критериев, имеющих четкое числовое выражение (цена, площадь и т.п.), в методике Саати нужно выбрать качественное сравнение и только потом количественное. И этому тоже есть объяснение – с качественной точки зрения соотношение между альтернативами не всегда соответствует соотношению их количественных признаков. Рассмотрим в качестве примера варианты ремонта автомобиля за счет страховых средств, ограниченных суммой 120 тыс. руб. Вся экономия остается у страховой компании, а излишки оплачиваются самостоятельно. В этом случае по критерию «Цена» два варианта ремонта за 30 тыс. руб. и за 120 тыс. руб. практически одинаковы, а вариант за 150 тыс. руб. уже принципиально хуже. Другим специфическим фактором является ограничение численных аналогов числом 9. Несмотря на возможность более чем 9-кратного превышения одного объекта над другим по какому-либо критерию, такой шкалы, как правило, достаточно, чтобы отразить качественное соотношение. Запишем план или этапы применения метода Саати. 1. Выделение проблемы. Определение цели. 2. Выделение основных критериев, обуславливающих достижение цели. 3. Выделение группы альтернатив, представляющих наибольший интерес. 4. Построение иерархии: дерево от цели через критерии к альтернативам. 5. Построение матрицы попарных сравнений критериев по цели. 6. Построение матриц попарных сравнений альтернатив по критериям. 7. Применение методики анализа полученных матриц. 8. Определение весов альтернатив по системе иерархии. 90 Продемонстрируем применение метода Саати по пунктам плана на примере. Пример. Организации, осуществляющей частое сопровождение договоров в другом городе, требуется купить квартиру там для проживания командированных сотрудников. Возможны поездки сотрудников разного пола. Возможно пребывание на квартире одновременно сотрудников разного ранга. Стоимость проезда по городу пребывания достаточно велика. На квартире сотрудники бывают в основном только в ночное время. 1. Выделение проблемы. Определение цели. Цель – квартира для временного проживания сотрудников при частых командировках. 2. Выделение основных критериев, обуславливающих достижение цели. После коллективного обсуждения на совете директоров определены следующие критерии:  цена;  размер;  количество комнат;  близость к работе;  категория дома. 3. Выделение группы альтернатив, представляющих наибольший интерес. После анализа предложений на рынке недвижимости выделены три наиболее интересных варианта:  Квартира 1;  Квартира 2;  Квартира 3. Рис. 2. Дерево иерархии для примера выбора рабочей квартиры 4. Построение иерархии: дерево от цели через критерии к альтернативам. 91 Дерево иерархии представлено на рис. 2. В ряде случаев выполнение этого пункта плана не обязательно. Тем не менее, дерево иерархий дает наглядное представление ситуации принятия решения и позволяет избежать некоторых ошибок при ее анализе. 5. Построение матрицы попарных сравнений критериев по цели. Путем коллективного обсуждения и, при необходимости, голосования сравниваются между собой критерии с точки зрения соответствия цели:  цена квартиры немного важнее размера;  цена квартиры и количество комнат одинаково важны;  цена квартиры и близость к месту работы важны одинаково, а по некоторым мнениям цена немного менее значима;  цена важнее категории дома;  размер менее важен или немного менее важен, чем количество комнат;  размер заметно менее важен, чем близость к работе;  размер квартиры и ее категория одинаково важны или размер немного важнее;  количество комнат и близость к работе одинаково важны;  количество комнат важнее или даже значительно важнее, чем категория дома;  близость квартиры к работе значительно или принципиально важнее категории дома. Таблица 2. Качественное сравнение критериев для примера покупки квартиры цена цена размер размер немного важнее комнаты близость категория одинаково важно одинаково или немного менее важно важнее заметно менее важно одинаково или немного более важно одинаково важно важнее или значительно важнее менее важно или немного менее важно комнаты 92 значительно или принципиально важнее близость категория Составляется таблица качественного сравнения критериев (табл. 2). Так как сравнения взаимны, то достаточно составить только ее часть, расположенную над главной диагональю: На основе таблицы качественного сравнения по таблице 1 строится таблица – матрица баллов (табл. 3). Под главной диагональю записываются числа, обратные к соответствующим числам над диагональю: a ji  1 aij . На диагонали всегда ставятся единицы, так как одинаковые критерии равны между собой: Таблица 3. Количественные баллы сравнения критериев для примера покупки квартиры цена размер комнаты близость категория цена 1 3 1 1/2 5 размер 1/3 1 1/4 1/7 2 комнаты 1 4 1 1 6 близость 2 7 1 1 8 категория 1/5 1/2 1/6 1/8 1 6. Построение матриц попарных сравнений альтернатив по критериям. Аналогично пункту 5 строятся матрицы сравнения отдельных альтернатив по каждому из критериев. Опустим подробное изложение всех операций и приведем ниже только матрицы количественных баллов (табл. 4 – 8): Таблица 4. Количественные баллы сравнения альтернатив по цене Квартира 1 Квартира 1 Квартира 2 Квартира 3 1 4 1/2 93 Квартира 2 1/4 1 1/5 Квартира 3 2 5 1 94 Таблица 5. Количественные баллы сравнения альтернатив по размеру Квартира 1 Квартира 2 Квартира 3 Квартира 1 1 1/2 3 Квартира 2 2 1 4 Квартира 3 1/3 1/4 1 Таблица 6. Количественные баллы сравнения альтернатив по количеству комнат Квартира 1 Квартира 2 Квартира 3 Квартира 1 1 1 2 Квартира 2 1 1 3 Квартира 3 1/2 1/3 1 Таблица 7. Количественные баллы сравнения альтернатив по близости к работе Квартира 1 Квартира 2 Квартира 3 Квартира 1 1 1/3 4 Квартира 2 3 1 5 Квартира 3 1/4 1/5 1 Таблица 8. Количественные баллы сравнения альтернатив по категории дома Квартира 1 Квартира 2 Квартира 3 Квартира 1 1 2 1/5 Квартира 2 1/2 1 1/6 Квартира 3 5 6 1 7. Применение методики анализа полученных матриц. Точные методы получения весов на основе матрицы сравнений крайне сложны. 95 Ниже рассмотрим один из алгоритмов приблизительного расчета весов по методу Саати. Его достоинством является возможность применения с использованием обычного бухгалтерского калькулятора. В конце раздела приведем еще один вариант алгоритма: более короткий, но требующий возможности возведения в дробные степени (для определения среднего геометрического). С каждой из полученных матриц применяем последовательность действий, описанных ниже. (Все действия продемонстрируем на матрице сравнения критериев. С матрицами сравнения альтернатив все операции выполняются аналогично). 7.1. Проводим нормировку матрицы:  находим сумму элементов каждого столбца S j  a1 j  a2 j  ...  anj (см. табл. 9);  делим все элементы матрицы на сумму элементов соответствующего столбца Aij  aij S j (см. табл. 10). Таблица 9. Определение сумм столбцов цена размер комнаты близость категория цена 1 3 1 1/2=0,5 5 размер 1/3=0,333 1 1/4=0,25 1/7=0,143 2 комнаты 1 4 1 1 6 близость 2 7 1 1 8 категория 1/5=0,2 1/2=0,5 1/6=0,167 1/8=0,125 1 СУММА 4,533 15,5 3,417 2,768 22 96 Таблица 10. Деление элементов на сумму соответствующего столбца цена размер комнаты близость категория цена 1/4,533 = 0,221 3/15,5 = 0,194 1/3,417 = 0,293 0,5/2,768 = 0,181 5/22 = 0,227 размер 0,333/4,533 = 0,074 1/15,5 = 0,065 комнаты 1/4,533 = 0,221 4/15,5= 0,258 1/3,417 = 0,293 1/2,768 = 0,361 6/22 = 0,273 близость 2/4,533 = 0,441 7/15,5 = 0,452 1/3,417 = 0,293 1/2,768 = 0,361 8/22 = 0,364 категория 0,2/4,533 = 0,044 0,5/15,5 = 0,032 0,25/3,417 = 0,143/2,768 = 0,073 0,052 0,167/3,417 = 0,125/2,768 = 0,049 0,045 2/22 = 0,091 1/22 = 0,045 7.2. Определяем веса строк. Для этого просто определяем среднее значение в каждой строке последней из полученных матриц: A  Ai 2   Ain  wi  i1 (см. табл. 11). n Таблица 11. Определение средних значений по строкам цена размер комнаты близость категория СРЗНАЧ цена 0,221 0,194 0,293 0,181 0,227 0,223 размер 0,074 0,065 0,073 0,052 0,091 0,071 комнаты 0,221 0,258 0,293 0,361 0,273 0,281 близость 0,441 0,452 0,293 0,361 0,364 0,382 категория 0,044 0,032 0,049 0,045 0,045 0,043 Полученный в итоге столбец задает веса строк матрицы, – в данном случае – веса критериев с точки зрения поставленной цели. Этот столбец называют весовым столбцом критериев по цели (см. табл. 12). 97 Таблица 12. Весовой столбец критериев по цели Вес в долях Вес в процентах цена 0,223 22,3% размер 0,071 7,1% комнаты 0,281 28,1% близость 0,382 38,2% категория 0,043 4,3% 7.3. Промежуточные выводы. С точки зрения удовлетворения нашей цели наиболее весомым является близость квартиры к месту работы (38,2%), далее следует количество комнат (28,1%), потом идет цена (22,3%). Размер и категория квартиры имеют наименьшие весовые коэффициенты, в сумме составляющие всего 11,4%. В некоторых случаях для упрощения анализа критерии, имеющие вес ниже заданного, могут быть исключены из рассмотрения. Действия 7.1 – 7.3 повторяем для всех матриц попарного сравнения альтернатив по критериям. Получаем следующие результаты (табл. 13 – 17): Таблица 13. Весовой столбец альтернатив по цене Вес в долях Вес в процентах Квартира 1 0,334 33,4% Квартира 2 0,098 9,8% Квартира 3 0,568 56,8% Таблица 14. Весовой столбец альтернатив по размеру Вес в долях Вес в процентах Квартира 1 0,320 32% Квартира 2 0,557 55,7% Квартира 3 0,123 12,3% 98 Таблица 15. Весовой столбец альтернатив по количеству комнат Вес в долях Вес в процентах Квартира 1 0,387 38,7% Квартира 2 0,443 44,3% Квартира 3 0,170 17% Таблица 16. Весовой столбец альтернатив по близости Вес в долях Вес в процентах Квартира 1 0,284 28,4% Квартира 2 0,619 61,9% Квартира 3 0,096 9,6% Таблица 17. Весовой столбец альтернатив по категории дома Вес в долях Вес в процентах Квартира 1 0,174 17,4% Квартира 2 0,103 10,3% Квартира 3 0,723 72,3% 8. Определение весов альтернатив по системе иерархии. 8.1. Столбцы весов в долях альтернатив по критериям объединяем в общую матрицу весов альтернатив по всем критериям (табл. 18). Таблица 18. Матрица весов альтернатив по всем критериям цена размер комнаты близость категория Квартира 1 0,334 0,320 0,387 0,284 0,174 Квартира 2 0,098 0,557 0,443 0,619 0,103 Квартира 3 0,568 0,123 0,170 0,096 0,723 99 8.2. Умножаем полученную матрицу на столбец весов критериев по цели матрично (по правилу строка на столбец):  0,223     0,334 0,320 0,387 0,284 0,174   0,071   0,322   0,098 0,557 0,443 0,619 0,103          0,281    0, 427   0,568 0,123 0,170 0,096 0,723  0,382  0, 251         0,043    В результате получаем веса альтернатив с точки зрения достижения поставленной цели (табл. 19). Как следует из таблицы, Квартира 2 является наиболее привлекательной для поставленной цели. Если же мы будем приобретать две квартиры, то это будут квартиры 2 и 1. Заметим, что веса альтернатив оказались достаточно близки друг к другу. Это говорит о разумном выделении всех трех квартир как объектов детального рассмотрения и анализа. Управленческое решение: покупать Квартиру 2. Таблица 19. Матрица веса альтернатив с точки зрения достижения поставленной цели Вес в долях Вес в % Квартира 1 0,322 32,2% Квартира 2 0,427 42,7% Квартира 3 0,251 25,1% Важное замечание. Таблицы весовых коэффициентов критериев по цели (табл. 12) и весов альтернатив по всем критериям (табл. 18) в некоторых случаях имеют собственную ценность. Например, в нашем случае, вектор весов критериев может использоваться многократно для разных городов. Кроме того, из него можно сделать вывод о малой важности критериев «размер» и «категория» и исключить их из рассмотрения. В других случаях неоднократно можно использовать матрицу весов альтернатив по критериям. Примером может служить составление таблицы весов подрядчиков по критериям выполнения определенных видов работ. При получении конкретного объекта и определении важности видов работ на нем можно будет подобрать оптимального подрядчика используя же существующую таблицу. 100 Автоматизация применения метода Саати Все описанные в вычисления легко реализовать в MS Excel. 1. Этап заполнения матрицы (жирным показаны заполняемые клетки, остальные вычисляются по формулам): 2. Этап поиска суммы и деления на нее: 101 3. Этап определения среднего значения в строке (весового столбца): 4. Этап умножения матриц: Важное замечание! Для реализации однотипных процедур для разных матриц рекомендуется: 1. Один раз аккуратно организовать работу с матрицей наибольшего размера. Оформить и проверить результат вычислений на отдельном листе MS Excel. 102 2. Скопировать лист в количестве, соответствующем числу матриц (число критериев + 1). Назвать листы соответственно по цели и по критериям. 3. Исправить на каждом листе лишь верхнюю диагональную часть матрицы попарных сравнений. Результат сразу будет получен. 4. На отдельном листе сформировать общую матрицу весовых коэффициентов альтернатив по критериям и там же столбец весов критериев по цели. Организовать процедуру умножения матриц с использованием функции МУМНОЖ. БОЛЕЕ КОРОТКИЙ ВАРИАНТ АНАЛИЗА МАТРИЦЫ В МЕТОДЕ СААТИ Далее опишем еще один вариант анализа матриц сравнения и получения на их основе весовых столбцов. Этот вариант изменяет подпункт 7 метода Саати. Пример применения этого подхода снова продемонстрируем на матрице сравнения критериев. 7.1. Находим среднее геометрическое для каждой строки матрицы: перемножаем элементы в строке и возводим результат в степень 1 n , где n – число столбцов:  находим произведение элементов каждой строки: Pi  ai1  ai 2   ain ;  возводим произведение в степень 1 n : Wi   Pi  1n (см. табл. 20). Таблица 20. Определение среднего геометрического для строк цена размер комнаты близость категория среднее геометрическое 5 1 5  1  3  1   5   1, 496 2   1 цена 1 3 1 1/2 1 размер 1/3 1 1/4 1/7 2 1 1 5 1   1    2   0, 474 4 7  3 комнаты 1 4 1 1 6 1  4 1 1  6  5  1,888 близость 2 7 1 1 8  2  7  1  1  8 5  2,569 категория 1 1 1/5 1/2 1/6 103 1/8 1 1 5 1 1 1 1       1  0, 291 5 2 6 8  7.2. Нормируем полученные результаты:  складываем полученные результаты: Wсумм  W1  W2   Wn ;  делим каждое Wi на их сумму: wi  Wi Wсумм (см. табл. 21). Таблица 21. Определение весов критериев цена размер комнаты близость категория ср. геом. Веса цена 1 3 1 1/2 5 1,496 1, 496  0, 223  22,3% 6,718 размер 1/3 1 1/4 1/7 2 0,474 0, 474  0,071  7,1% 6,718 комнаты 1 4 1 1 6 1,888 1,888  0, 281  28,1% 6,718 близость 2 7 1 1 8 2,569 2,569  0,382  38, 2% 6,718 категория 1/5 1/2 1/6 1/8 1 0,291 0, 291  0,043  4,3% 6,718 Сумма 6,718 1  100% Сравнивая с первым способом получения столбца весов (см. табл. 12), можно заметить, что результаты практически идентичны. Чем выше согласованность сравнений (см. следующий подраздел), тем ближе между собой результаты обоих способов. Как видно, данный способ требует гораздо меньше места и количества вычислений. Его можно реализовать на одной исходной таблице, дописав справа два столбца. Реализация данного способа в MS Excel также гораздо проще. Стоит заметить, что среднее геометрическое вычисляется с помощью стандартной Статистической функции Excel: СРГЕОМ. При решении задания и сдаче экзамена можно пользоваться любым из приведенных способов получения весов по матрице сравнения. Использование двух способов не нужно. 104 Оценка непротиворечивости сравнений В ряде случаев представляется важным, чтобы не было существенных противоречий в сравнениях: сравнения были согласованными. Простейшим примером несогласованного сравнения является такой: красный автомобиль лучше зелёного; зелёный намного лучше синего; синий автомобиль принципиально лучше красного. В этом примере появляется так называемый «замкнутый круг» сравнений. Соответствующая матрица сравнений представлена в табл. 22: Таблица 22. Таблица существенно несогласованных сравнений красный зеленый синий красный 1 1/5 9 зеленый 5 1 1/7 синий 1/9 7 1 Проверка согласованности представляется особенно важной при использовании результатов экспертного опроса. В случаях сравнения по критериям с высокой долей субъективной составляющей, проверку согласованности можно не проводить. Проверка согласованности для матрицы сравнения проводится после определения весов по следующему алгоритму: 1. Вычисляем суммы элементов столбцов для матрицы сравнений: S j  a1 j  a2 j  ...  anj 2. Умножаем поэлементно полученные значения и значения вектора весов и складываем результаты (сумма первого столбца, умноженная на вес первой строки, плюс сумма второго столбца, умноженная на вес второй строки и т.д.): L  S1  w1  S2  w2   Sn  wn 3. Находим индекс согласования по формуле: Ln ИС  n 1 4. Находим отношение согласованности по формуле: ИС ОС  СИ где СИ – случайный индекс согласованности, который определяется в зависимости от числа строк матрицы n сравнения по таблице 23. 105 Таблица 23. Значения индекса случайной согласованности n СИ 3 4 5 6 7 8 9 10 11 12 13 14 0,58 0,90 1,12 1,24 1,32 1,41 1,45 1,49 1,51 1,48 1,56 1,57 5. Сравнения считаются согласованными, если: OC  0,1. В ряде случаев (как правило, при сравнении по сильно субъективному критерию) можно считать неплохо согласованными сравнения при OC  0,15 и даже при OC  0,2 . Проверим согласованность сравнений для нашего сравнения критериев (табл. 3). В этих вычислениях будет n  5 , так как в матрице сравниваются 5 вариантов. Суммы элементов столбцов найдены в таблице 9, а веса строк найдены в таблице 12. Перемножим их поэлементно и сложим: L  4,533  0,223  15,5  0,071  3,417  0,281  2,768  0,382  22  0,043  5,075 Находим индекс согласованности: 5,075  5 ИС   0,019 5 1 Находим отношение согласованности: 0,019 ОС   0,017  0,1 1,12 Вывод: сравнения критериев (табл. 2), отраженные в матрице табл. 3 согласованы. В качестве примера разберите самостоятельно матрицу сравнений табл. 22. Убедитесь, что сформированные сравнения не согласованы. (Для проверки: отношение согласованности в этом случае будет равно 4,37). Пример применения метода Саати для выбора оптимального предложения компьютерной техники (на примере открытых предложений крупнейших ритейлеров Республики Татарстан) В качестве примера практического применения освоенного мощного инструмента принятия решения используется такая задача на актуальных данных. 106 С использованием сети интернет (Сайты крупнейших поставщиков компьютерной техники, предложения которых так же есть на территории Республики, например, DNS, Citilink, Eldorado и др.) выбираются варианты оснащения компьютерной техники на примере компьютерного класса. На лекции обсуждается вариант сравнения привлечения данных средств по трем критериям: стоимость, производительность, спектр услуг (тут возможны варианты: гарантии, доставка, обслуживание и др.). Выясняются характерные ценностные соотношения по критериям. Обсуждаются сравнения предложений. Задача предоставляется студентам на дом для окончательного анализа. 107 МНОГОШАГОВАЯ ОПТИМИЗАЦИЯ Примеры многошаговых задач динамического программирования В экономико-управленческой практике очень часто возникают ситуации, когда ЛПР нужно получить оптимальный результат не сразу, а за несколько этапов или через определенное время. Приведем самые яркие примеры таких задач. 1. Задачи инвестирования в бизнес. В этом случае инвестор не хочет получить максимум прибыли сразу. Он даже остается в убытке в течение некоторого времени. Целью является получение максимальной прибыли за длительный промежуток времени или получение максимальной прибыли, начиная с некоторого года функционирования предприятия. 2. Задача планирования комплекса работ. В этом случае нам нужно определить цепочку работ, имеющую самую большую продолжительность. При этом на каждом этапе не обязательно выбирать самую продолжительную работу, а требуется найти именно максимальную сумму продолжительности работ от старта проекта до окончания. 3. Задача об оптимальном использовании истощаемых и возобновляемых ресурсов. При этом необходимо получить наибольший экономический выигрыш на совокупности этапов с учетом того, что разные решения приводят не только к разным выигрышам, но и к разным расходам ресурса, определяющего дальнейшую деятельность. Методы решения динамических задач оптимизации Динамическое программирование (ДП) – метод оптимизации, приспособленный к операциям, в которых процесс принятия решения может быть разбит на этапы (шаги). Такие операции называются многошаговыми. Начало развития ДП относится к 50-м годам XX в. Оно связано с именем Р. Беллмана2. Если модели линейного программирования можно использовать в экономике для принятия крупномасштабных плановых решений в сложных ситуациях, то модели ДП применяются при решении задач значительно меньшего масштаба, например, при разработке правил управления запасами, устанавливающими момент пополнения запасов и размер пополняющего заказа; при разработке принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию; при распределении дефицитных капитальных вложений между возможными новыми направлениями их использования; при составлении календарных планов текущего и капитального ремонта сложного оборудования и его замены; при разработке долгосрочных правил замены выбывающих из эксплуатации основных фондов и т. п. В реально функционирующих больших экономических системах еженедельно требуется принимать микроэкономические решения. Модели ДП ценны тем, 2 Беллман Р.Э. (р. 1920 г.) – американский математик. 108 что позволяют на основе стандартного подхода с использованием при минимальном вмешательстве человека принимать такие, решения. И если каждое взятое в отдельности такое решение малосущественно, то в совокупности эти решения могут оказать большое влияние на прибыль. Общая постановка задачи динамического программирования Приведем общую постановку задачи ДП. Рассматривается управляемый процесс, например, экономический процесс распределения средств между предприятиями, использования ресурсов в течение ряда лет, замены оборудования, пополнения запасов и т. п. В результате управления система (объект управления) S переводится из начального состояния s0 в состояние ŝ. Предположим, что управление можно разбить на n шагов, т.е. решение принимается последовательно на каждом шаге, а управление, переводящее систему S из начального состояния в конечное, представляет собой совокупность n пошаговых управлений. Обозначим через Xk управление на k-м шаге (k = 1, 2, ..., n). Переменные Xk удовлетворяют некоторым ограничениям и в этом смысле называются допустимыми (Xk может быть числом, точкой в n-мерном пространстве, качественным признаком). Пусть X (X1, X2 ..., Xn) – управление, переводящее систему S из состояния s0 в состояние ŝ. Обозначим через sk состояние системы после k-го шага управления. Получаем последовательность состояний s0, s1, ..., sk-1, sk, ..., sn-1, sn = ŝ, которую изобразим кружками s0 X1 s1 Xk sk… sk Xk+1 Xn-1 … 1 sn- Xn ŝn 1 Рис. 12.1 Показатель эффективности рассматриваемой управляемой операции – целевая функция – зависит от начального состояния и управления: Z = F (s0, X). (124) Сделаем несколько предположений. 1. Состояние sk системы в конце k-го шага зависит только от предшествующего состояния sk-1 и управления на k-м шаге Xk (и не зависит от предшествующих состояний и управлений). Это требование называется "отсутствием последействия". Сформулированное положение записывается в виде уравнений sk = φk (sk-1, Xk), k = 1, 2, …, n, (12.2) которые называются уравнениями состояний. 2. Целевая функция (12.1) является аддитивной от показателя эффективности каждого шага [3]. Обозначим показатель эффективности k-го шага через Zk = fk (sk-1, Xk), k = 1, 2, …, n, (12.3) тогда n Z   f k ( s k 1 , X k ) . (12.4) k 1 Задача пошаговой оптимизации (задача ДП) формулируется так: определить 109 такое допустимое управление Х, переводящее систему S из состояния s0 в состояние ŝ, при котором целевая функция (12.4) принимает наибольшее (наименьшее) значение. Выделим особенности модели ДП: 1. Задача оптимизации интерпретируется как n-шаговый процесс управления, 2. Целевая функция равна сумме целевых функций каждого шага. 3. Выбор управления на k-м шаге зависит только от состояния системы к этому шагу, не влияет на предшествующие шаги (нет обратной связи). 4. Состояние sk после k-го шага управления зависит только от предшествующего состояния sk-1 и управления Xk (отсутствие последействия). 5. На каждом шаге управление Xk зависит от конечного числа управляющих переменных, а состояние sk – от конечного числа параметров (смысл замечания 5 станет ясным из рассмотренных ниже примеров). Следует вспомнить, что существуют различные способы решения подобных задач, применяемые в зависимости от вида функций, ограничений, размерности и т.п. Рассмотрим вычислительную схему ДП, которая окажется безразличной к способам задания функций и ограничений. Вычислительная схема связана с принципом оптимальности и использует рекуррентные соотношения. Принцип оптимальности и уравнения Беллмана Принцип оптимальности впервые был сформулирован Р. Беллманом в 1953 г. Каково бы ни было состояние s системы в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный3. Беллманом четко были сформулированы и условия, при которых принцип верен. Основное требование – процесс управления должен быть без обратной связи, т.е. управление на данном шаге не должно оказывать влияния на предшествующие шаги. Принцип оптимальности утверждает, что для любого процесса без обратной связи оптимальное управление таково, что оно является оптимальным для любого процесса по отношению к исходному состоянию этого подпроцесса. Поэтому решение на каждом шаге оказывается наилучшим с точки зрения управления в целом. Если изобразить геометрически оптимальную траекторию в виде ломаной линии, то любая часть этой ломаной будет являться оптимальной траекторией относительно начала и конца. Уравнения Беллмана. Вместо исходной задачи ДП (см. разд. 12.1) с фиксированным числом шагов n и начальным состоянием s0 рассмотрим последовательность задач, полагая последовательно n = 1, 2, … при различных s – одношаговую, двухшаговую и т.д., – используя принцип оптимальности. 3 Формулировка принадлежит Е.С.Вентцель [3] и немного отличается от предложенной Беллманом. 110 Введем ряд новых обозначений. Обозначения в ДП несут большую информационную нагрузку, поэтому очень важно их четко усвоить. На каждом шаге любого состояния системы sk-1 решение Xk нужно выбирать "с оглядкой", так как этот выбор влияет на последующее состояние sk и дальнейший процесс управления, зависящий от sk. Это следует из принципа оптимальности. Но есть один шаг, последний, который можно для любого состояния sn-1 планировать локально-оптимально, исходя только из соображений этого шага. Рассмотрим n-й шаг: sn-1 – состояние системы к началу n-го шага, sn = ŝ – конечное состояние, Xn – управление на n-м шаге, а fn (sn-1, Xn) – целевая функция (выигрыш) n-го шага. Согласно принципу оптимальности, Xn нужно выбирать так, чтобы для любых состояний sn-1 получить максимум4 целевой функций на этом шаге. Обозначим через Z n* (sn1 ) максимум целевой функции – показателя эффективности n-го шага при условии, что к началу последнего шага, система S была в произвольном состоянии sn-1, а на последнем шаге управление было оптимальным. Z n* ( s n1 ) называется условным максимумом целевой функции на n-м шаге. Очевидно, что (12.5) Z n* ( s n1 )  max f n ( s n1 , X n ) {X n} Максимизация ведется по всем допустимым управлениям Хn. Решение Хn, при котором достигается Z n* (sn1 ) , также зависит от sn-1 и называется условным оптимальным управлением на n-м шаге. Оно обозначается через Х n* (sn1 ) . Условно оптимальный выигрыш на n-м sn-2 sn-2 fn-2 (sn-2, Xn-1) sn-2 Значение целевой функции (n-1)го шага при произвольном управлении Хn-1 и состоянии Sn-2 Рис. 12.2 Решив одномерную задачу локальной оптимизации по уравнению (12.5), найдем для всех возможных состояний sn-1 две функции: Z n* (sn1 ) и Х n* (sn1 ) . Рассмотрим теперь двухшаговую задачу: присоединим к n-му шагу (n-1)-й (рис, 12.2). Для любых состояний sn-2 произвольных управлений Xn-1 и оптимальном управлении на n-м шаге значение целевой функции на двух последних шагах равно: 4 Ограничимся здесь задачей максимизации целевой функции. 111 f n1 (sn2 , X n1 )  Z n* (sn1 ) . (12.6) Согласно принципу оптимальности для любых sn-2 решение нужно выбирать так, чтобы оно вместе с оптимальным управлением на последнем (n-м) шаге приводило бы к максимуму целевой функции на двух последних шагах. Следовательно, нужно найти максимум выражения (12.6) по всем допустимым управлениям Хn-1. Максимум этой суммы зависит от sn-2, обозначается через Z n* ( s n1 ) и называется условным максимумом целевой функции при оптимальном управлении на двух последних шагах. Соответствующее управление Хn-1 на (n-1)-м шаге обозначается через X n*1 (sn2 ) и называется условным оптимальным управлением на (n-1)-м шаге. Z n*1 ( s n2 )  max{ f n1 ( s n2, X n1 )  Z n* (s n1 )} . (12.7) {x } n 1 следует обратить внимание на то, что выражение, стоящее в фигурных скобках (12.7), зависит только от sn-2 и Хn-1, так как sn-1 можно найти из уравнения состояний (12.2) при k = n – 1 sn-1 = φn-1 (sn-2, Xn-1) и подставить вместо sn-1 в функцию Z n* (sn1 ) . В результате максимизации только по одной переменной Хn-1 согласно уравнению (12.7) вновь получаются две функции: Z n*1 ( s n2 ) и Х n*1 ( s n2 ) . Далее рассматривается трехшаговая задача: к двум последним шагам присоединяется (n-2)-й и т. д. Обозначим через Z k* (sk 1 ) условный максимум целевой функции, полученный при оптимальном управлении на n – k + 1 шагах, начиная с k-го до конца, при условии, что к началу k-го шага система находилась в состоянии sk-1. Фактически эта функция равна n Z k* ( s k 1 )  max  f (s Z k*1 ( s k )   f (s {( xk , ...,xn )} i k i i 1 , Xi ) Тогда … sk-1 Xk n max {( xk 1 , ...,xn )} sk i  k 1 i i 1 , Xi ) … ŝ fk (sk-1, Xk) Рис. 12.3 Целевая функция на n – k последних шагах (рис. 12/3) при произвольном управлении Xk на k-м шаге и оптимальном управлении на последующих n – k шагах равна 112 f k (s k 1 , X k )  Z k*1 (sk ) Согласно принципу оптимальности, Хк выбирается из условия максимума этой суммы, т.е. (12.8) Z k* (sk 1 )  max f k (sk 1 , X k )  Z k*1 (sk ) , {X } k k = n – 1, n – 2, …, 2, 1. Управление Хk на k-м шаге, при котором достигается максимум в (12.8), обозначаемся через X k* (sk 1 ) и называется условным оптимальным управлением на k-м шаге (в правую часть уравнения (12.8) следует вместо sk подставить выражение sk = φk (sk-1, Xk), найденное из уравнений состояния). Уравнения (12.8) называют уравнениями Беллмана. Это рекуррентные соотношения, дозволяющие найти предыдущее значение функции, зная последующие. Если из (12.5) найти Z n* (sn1 ) , то при k = n – 1 из (12.8) можно определить, решив задачу максимизации для всех возможных значений sn-2, выражения для Z n*1 ( s n2 ) , и соответствующее Х n*1 ( s n2 ) . Далее, зная Z n*1 ( s n2 ) находим, используя (12.5) и (12.8), уравнение состояний. Процесс решения уравнений (12.5) и (12.8) называется условной оптимизацией5. В результате условной оптимизации получаются две последовательности: Z n* (sn1 ), Z n*1 (sn2 ),..., Z 2* (s1 ), Z1* (s0 ) – условные максимумы целевой функции на последнем, на двух последних, на ...n шагах и X n* (sn1 ), X n*1 (sn2 ),..., X 2* (s1 ), X 1* (s0 ) – условные оптимальные управления на n-м, (n – l)-м, ..., 1-м шагах. Используя эти последовательности, можно найти решение задачи ДП при данных n и s0. По определению (см. разд. 12.1) Z1* ( s0 ) – условный максимум целевой функции за N шагов при условии, что к началу 1-го шага система была в состоянии s0, т.е. (12.9) Z max  Z1* (s0 ) . Далее следует использовать последовательность условных оптимальных управлений и уравнения состояний (12.2). При фиксированном s0 получаем X 1*  X 1* (s0 ) . Далее из уравнений (12.2) находим s1*  1 (s0 , X 1* ) и подставляем это выражение в последовательность условных оптимальных управлений: X 2*  X 2* (s1* ) и т.д. по цепочки6: X 1*  X 1* (s0 )  s1*  1 (s0 , X 1* )  X 2*  X 2* (s1* )  s2*   2 (s1* , X 2* )  X 3*  X 3* (s2* )  ...  sn*1   n1 (s  1 (s0 , X 1* )  X 2*  X 2* (s1* )  s2*   2 (s1* , X 2* )  X 3*  X 3* (s2* )  ...  sn*1   n1 (sn*2 , X n*1 )  X n*  X n* (sn*1 ) Получаем оптимальное решение задачи ДП: X *  ( X 1* , X 2* ,..., X n* ). 5 Здесь описан способ решения задачи ДП, начинающийся с последнего шага ("обратная схема"). Можно n-й и 1-й шаги поменять местами (“прямая схема”) 6 Через sk* здесь обозначено состояние системы после k-го шага при условии, что на k-м шаге выбрано оптимальное управление. 113 (Стрелка  означает использование уравнений состояния, а стрелка  – последовательности условных оптимальных управнений). Прежде чем перейти к конкретным задачам, следует усвоить общую схему применения метода ДП. Предположим, что все требования, предъявляемые к задаче методом ДП, выполнены. (Эти требования сформулированы в разд. 12.1). Построение модели ДП и применение метода ДП для решения сводится к следующим моментам: 1. Выбирают способ деления процесса управления на шаги. 2. Определяют параметры состояния s k и переменные управления Хk( на каждом шаге. 3. Записывают уравнения состояний. 4. Вводят целевые функции k-ro шага и суммарную целевую функцию. 5. Вводят в рассмотрение условные максимумы (минимумы) Zk* (sк-1) и условное оптимальное управление на k-м шаге: Хк* (sk-1), k = п,n- 1, ..., 2, 1. 6. Записывают основные для вычислительной схемы ДП уравнения Беллмана для Zn* (sn-1) и Zk*(sk-1), k=n-1, ..., 1. 7. Решают последовательно уравнения Беллмана (условная оптимизация) и получают две последовательности функций: {Zk*(sk-1)} и {Xk*(sk-1)}/ 8. После выполнения условной оптимизации получают оптимальное решение для конкретного начального состояния s0: а) Zmax = Z1* (s0) и б) по цепочке s0 => Х1*-> s1*=> Х2* -> s2* => ... => Х*n-1-> s*n-1=> X*n ->s*n оптимальное управление: X*(X*1,X*2, … ,X*n). Решая задачи, следует по возможности придерживаться этой схемы по крайней мере в начале изучения темы. Рассмотрим, как работает схема на примере задачи об оптимальном распределении ресурсов между двумя отраслями на п лет. Примеры прикладных задач динамического программирования: задача оптимального распределения инвестиций, задачи о поиске кратчайшего и критического пути, задача об оптимальном использовании истощаемых и возобновляемых ресурсов Пример (задача оптимального распределения инвестиций). Рассмотрим предложенную выше схему на конкретной задаче о распределении инвестиционных средств между предприятиями. Планируется деятельность четырех промышленных предприятий (системы) на очередной год. Начальные средства: s0 = 5 усл. ед. Размеры вложения в каждое предприятие кратны 1 усл. ед. Средства х, выделенные k-му предприятию (k=1, 2, 3, 4), приносят в конце года прибыль fk (x). Функции fk (х) заданы таблично (табл. 12.1). Принято считать, что: а) прибыль fk (x) не зависит от вложения средств в другие предприятия; 114 б) прибыль от каждого предприятия выражается в одних условных единицах; в) суммарная прибыль равна сумме прибылей, полученных от каждого предприятия. Определить, какое количество средств нужно выделить каждому предприятию, чтобы суммарная прибыль была наибольшей. Таблица 12.1 x f1(x) f1(x) f1(x) f1(x) 1 8 6 3 4 2 10 9 4 6 3 11 11 7 8 4 12 13 11 13 5 18 15 18 16 Решение. Обозначим через xk количество средств, выделенных k-му предприятию. (Нумерацию предприятий 1, 2, 3, 4 сохраняем в процессе решения неизменной.) Суммарная прибыль равна 4 (12.10) Z   f k ( xk ) . k 1 Переменные х удовлетворяют ограничениям: 4 x k 1 k  5, (12.11) xk  0, k  1,2,3,4. Требуется найти переменные х1, x2, х3, x4, удовлетворяющие системе ограничений (12.11) и обращающие в максимум функцию (12.10). Особенности модели. Ограничения линейные, но переменные целочисленные, а функции fk (хk) заданы таблично, поэтому нельзя применить методы целочисленного линейного программирования. Схема решения задачи методом ДП имеет следующий вид: процесс решения распределения средств s0 = 5 можно рассматривать как 4-шаговый, номер шага совпадет с номером предприятия; выбор переменных x1, x2, x3, x4 – управление соответственно на I, II, III, IV шагах. ŝ – конечное состояние процесса распределения – равно нулю, так как все средства должны быть вложены в производство, ŝ = 0. Схема распределения показана на рис. 12.4. Уравнения состояний (12.2) в данной задаче имеют вид: sk = sk-1 – xk, k = 1, 2, 3, 4, (12.12) где sk – параметр состояния – количество средств, оставшихся после k-го шага, т.е.средства, которые остается распределить между оставшимися 4-k предприятиями. 115 5 s1=5-x1 s2=s1-x2 x1 x2 s4=s3-x4= s3=s2-x3 x3 x4 =0 Рис. 12.4 Введем, в рассмотрение функцию Z k* (sk 1 ) – условную оптимальную прибыль, полученную от k-го, (k+1)-го, ..., 4-го предприятий, если между ними распределялись оптимальным образом средства sk-1 (0 ≤ sk-1 ≤ 5). Допустимые управления на k-м шаге удовлетворяют условию: 0 ≤ хk ≤ sk-1 (либо k-му предприятию ничего не выделяем, xk = 0, либо не больше того; что имеем к k-му шагу, хk ≤ sk-1). Уравнения (12.5) и (12.8) имеют вид: (а) k  4, s4  0  Z 4* ( s3 )  max f 4 ( x4 ) , 0 x s  ( s )  max f ( x )  Z 4 3 Z ( s2 )  max f 3 ( x3 )  Z ( s3 ) (б) Z 2* , ( s ) , (в) , (г) * 3 0 x3  s2 1 0 x2  s1  2 2 * 4 * 3 2 Z1* (5)  max f1 ( x1 )  Z 2* ( s1 ) 0 x1 5 Последовательно решаем записанные уравнения, проводя условную оптимизацию (см. рис. 12.4) каждого шага. IV шаг. В табл. 12.1 f4(х) прибыли монотонно возрастают, поэтому все средства, оставшиеся к IV шагу, следует вложить в 4-е предприятие. При этом для возможных значений s3 = 0, 1, …, 5 получим: Z 4* (s3 )  f 4 (s3 ) и x4* ( s3 )  s3 . III шаг. Делаем все предположения относительно остатка и средств s2 к III шагу (т.е. после выбора х1 и x2). s2 может принимать значения 0, 1, 2, 3, 4, 5 (например, s2 = 0, если все средства отданы 1-му и 2-му предприятиям, s2=5, если 1-е и 2-е предприятия ничего не получили, и т.д.). В зависимости от этого выбираем 0 ≤ х3 ≤ s2 находим s3 = s2 – x3 и сравниваем для разных x3 при фиксированном s2 значения суммы f3 (x3) + Z 4* (s3 ) . Для каждого s2 наибольшее из этих значений есть Z 3* (s2 ) – условная оптимальная прибыль, полученная при оптимальном распределении средств s2 между 3-м и 4-м предприятиями. Оптимизация дана в табл. 12.2 при k = 3. Для каждого значения s2 Z 3* (s2 ) и X 3* (s2 ) помешены в графах 5 и 6 соответственно. II шаг. Условная оптимизация, согласно уравнению (в), проведена в табл. 12.2 при k = 2. Для всех возможных значений s1 значения Z 2* (s1 ) и X 2* (s1 ) находятся в столбцах 8 и 9 соответственно; первые слагаемые в столбце 7 – значения f2 (x2) взяты из табл. 12.1, а вторые слагаемые взяты из столбца 5 табл. 12.2 при s2 = s1 – x2. I шаг. Условная оптимизация (уравнение (г)) проведена в табл. 12.2 при k=1 116 для s0 = 57. Поясним решение подробно: если x1 = 0, то s1 = 5, прибыль, полученная от четырех предприятий при условии, что s1 = 5 ед. средств между оставшимися тремя предприятиями будут распределены оптимально, равна f1 (0) + Z 2* (5) = 0 + 19 = 19 ( Z 2* (5) взято из столбца 9 табл. 12.2 при s1 = 5). Если х1 = 1, то s2 = 4. Суммарная прибыль при условии, что s2 = 4 ед. средств между оставшимися тремя предприятиями будут распределены оптимально, равна f1 (1) + Z 2* (4) = 8 + 16 = 24 (f1(1) взято из табл. 12.1, a Z 2* (4) – из столбца 9 табл. 12.2.) Аналогично при х1 = 2, s2=3 и f1(2)+ Z 2* (3) = 10 + 13 = 23; при х1 = 3, s2= 2 и f1(3) + Z 2* (3) = 11 + 10 = 21; при х1 = 4, s2= 1 и f1(4) + Z 2* (1) = 12 + 16 = 28; при х1 = 5, s2= 0 и f1(5) + Z 2* (0) = 18 + 0 = 18; Сравнивая подчеркнутые числа, получим Z1* (5) = 24 усл. ед. = Zmax при x1*  x1* (5)  1 . Используя уравнения (12.12), получим s1* = 5 – 1 = 4, а по табл. 12.2 в столбце 9 находим x2*  x2* (4)  2 Далее находим s2* = 4 – 2 = 2, а по табл. 12.2 в столбце 6 – x3*  x3* (2)  1 . Наконец, s3* = 2 – 1 = 1 и x4*  x4* (1)  1 ,т.е. X * (1; 2; 1; 1). Максимум суммарной прибыли равен 24 усл. ед. средств при условии, что 1му предприятию выделено 1 усл. ед.; 2-му предприятию – 2 усл. ед.; 3-му предприятию – 1 усл. ед.; 4-му предприятию – 1 усл. ед.  Замечание 1. Решение четырехмерной задачи 12.1 на определение условного экстремума сведено фактически к решению четырех одномерных задач: на каждом шаге определялась одна переменная x. Замечание 2. На разобранной задаче 12.1 видно, что метод ДП безразличен к виду и способу задания функции: fk (х) были заданы таблично, поэтому и Z k* (s) и X k* (s) принимали дискретные значения, представленные в табл. 12.2. Таблица 12.2 k=3 k=2 k=1 sk* * * * Z3 x3 Z2 Z1* x2 x1* xk sk f3(x3)+ f3(x3)+ f3(x3)+ 1 Z (s ) Z (s ) Z (s ) (s2) (s2) (s1) (s1) (s0) (s0) 1 2 3 4 5 6 7 8 9 10 11 12 0 0 0 0 1 0+4=4 0+6=6 0+4=4 1 4 6 1 8 1 1 0 3+0=3 6+0=6 8+0=8 0 2 0+6=6 0+7=7 0+10=10 2 1 1 10 1 14 1 3+4=7 7 1 6+4=10 8+6=14 2 0 4+0=4 9+0=9 10+0=10 0 3 0+8=8 0+9=9 0+13=13 1 2 3+6=9 6+7=13 1 8+10=18 3 9 1 13 18 1 2 1 4+4=8 10+6=16 9+4=13 2 3 0 7+0=7 11+0=11 11+0=11 * 4 7 3 * 4 3 На I шаге условной оптимизации достаточно заполнить раздел таблицы, соответствующий s0 = 5 117 * 4 3 4 5 1 2 3 4 1 2 3 4 5 4 3 2 1 5 4 3 2 1 0+13=13 3+8=11 4+6=10 7+4=11 11+0=11 0+16=16 3+13=16 4+8=12 7+6=13 11+4=15 18+0=18 13 18 5 0+13=13 6+9=15 9+7=16 11+4=15 13+0=13 0+18=18 6+13=19 9+9=18 11+7=18 13+4=17 11+0=15 16 2 19 1 0+16=16 8+13=21 10+10=20 11+6=17 12+0=12 0+19=19 8+16=24 10+13=23 11+10=21 12+6=18 18+0=18 21 1 24 1 Замечание .3. Альтернативой между ДП для подобной дискретной задачи является метод перебора. Метод ДП предпочтительнее, так как на этапе условной оптимизации отбрасываются заведомо негодные варианты. Замечание 4. Достоинством метода является возможность анализа ранения на чувствительность к изменению s0 и n. Проведенные расчеты можно использовать для изменившихся начального состояния s0 и числа шагов n. Например, пусть в задаче 12.1 произошло уменьшение начальных средств на 1 усл. ед. Для s0=4 достаточно в таблицу добавить расчеты при k=1 (это сделано в той же табл. 12.2). Получаем в этом случае Zmax=21 усл. ед. при распределении: x1* =1 s1* =4-1=3 x2* =1, или x2* =2 s2* =3-1=2, или s2* =3-2=1 x3* =1, или x3* =0 s3* =2-1=1, или s3* =1-0=1 x4* =1. В результате найдены два оптимальных решения: X(1)*(1; 1; 1; 1) и X(2)* (1; 2; 0; 1). Если начальные средства увеличились, например, на 1 усл. ед., s0=6, а функции прибыли fk(х) остались прежними, то в табл. 12.2 достаточно добавить раздел для s0=6 при k=3, 2, 1; этот фрагмент расчетов помещен в табл. 12.3. Таблица 12.3 1 2 3 4 5 6 7 8 9 10 11 12 0 6 0+16=16 0+22=22 0+24=24 1 5 3+16=19 6+18=24 8+19=27 2 4 4+13=17 9+13=22 10+16=26 6 3 3 7+8=15 22 5 11+9=20 24 1 11+13=24 27 1 4 2 11+6=17 13+7=20 12+10=22 5 1 18+4=20 15+4=19 18+6=24 6 0 18+0=18 15+0=15 18+0=18 * * * * Получаем Zmax=27, x1 =1  s1 =6-1=5  x2 =1  s2 =5-1=4  x3* =0  s3* =4-0=4  x4* =4. Оптимальное решение Х*(1; 1; 0; 4). Если принято решение распределить средства s0=5 между 2-, 3- и 4-м предприятиями, то задача уже решена в табл. 12.2. В разделе k=2 таблицы находим Zmax= Z x* (5) =19 при условии, что =1, x3* .=0, x4* =4. 118 Наконец, если увеличилось количество предприятий (число шагов), то схему можно дополнить, присоединяя шаги с номерами k=0, -1, ... и т.д. Например, пусть средства ξ0 = 6 распределяются между пятью предприятиями. Функция прибыли для пятого предприятия задана формулой f(x)=3x+1, если x≠0 и f(0)=0. Присвоим 5-му предприятию номер k=0, тогда x0 – средства, выделенные этому предприятию. Обозначим через Z 0* (6) оптимальную прибыль, полученную от пяти предприятий: Z 0* (6)  max f 0 ( x0 )  Z1* (s1 ), 0 x0 6 a s1=6-x0. Условная оптимизация 0-го шага дана в табл. 12.4. Z1* ( s1 ) Таблица 12.4 x0 0 1 2 3 4 5 6 s1=6-x0 6 5 4 3 2 1 0 f(0)=0 0 4 7 10 13 16 19 (взята из табл. 12.2 и 12.3 при k=1) 27 24 21 18 14 8 0 f(x0)+Z1(s1) 27 28 28 28 27 24 19 Следовательно, Zmax=28, а оптимальных решений четыре X 1* (1;1;2;1;1), X 2* (2;1;1;1;1), X 3* (2;1;2;0;1),.. X 4* (3;1;1;0;1). Замечание 5. К недостаткам метода по-прежнему следует отнести возникновение технических трудностей при вычислениях в случае увеличения размерности. Если каждое управление X k* будет зависеть от r переменных, а состояние sk* – от p параметров, то на каждом шаге возникает rp-мерная задача оптимизации. (В задаче 12.1 r=l, p=1, т.е. решалась одномерная задача). Даже при реализации метода ДП на ЭВМ практически можно решать задачи для небольших r, p, n. Пример (задача о поиске кратчайшего и критического пути): Найти самый короткий путь от A до F в сетевом графике (рис. 8). B C 18 4 9 5 A D 17 12 12 3 E 14 G 2 6 F Рис. 8. Сетевой график РЕШЕНИЕ Задачу минимизации пути (поиска наиболее короткого пути) удобнее интерпретировать в терминах «тратит»: то, что стоит над стрелками рассматривать как некоторые затраты (времени, средств и т. п.). И наоборот, задачу максимизации пути (поиска самого длинного пути) 119 удобнее интерпретировать в терминах «приобретений»: то, что над стрелками рассматривать как некоторые приобретения (прибыль, доход и т. п.). В нашем случае будем считать, что величины над стрелками эквивалентны некоторым затратам. Задача оптимизации сетевого графика является задачей динамического программирования и решается в два этапа: 1) перемещение с конца в начало, при этом в каждую позицию-кружок необходимо записывать наилучшие результаты (в нашем случае – наименьшие затраты) от этого места до конца пути и помечать ту стрелку, по которой надо двигаться с этого места, чтобы эти результаты были наилучшими; 2) движение с начала в конец, при этом двигаясь по «лучшим» стрелкам надо «собрать» весь оптимальный путь. Задача решается на одном сетевом графике. Для пояснений действий на каждом этапе будем отображать последовательно состояния сетевого графика, выделяя обрабатываемые элементы (таблица). 120 Таблица Рассмотрим конечную позицию в сетевом графике G. Если мы находимся в G, то мы уже дошли до конца и больше ничего не потратим. Соответственно ставим в кружок G число 0. B 4 9 5 A D 17 12 12 C 18 4 6 F 14 B 9 5 A D 17 12 E 2 12 3 14 G 2 3 E Посмотрим, какую позицию можно заполнить на следующем шаге. Можно ли заполнить кружок C? Рассмотрим все стрелки, выходящие из C (их две). Для первой (где написано 9) мы знаем, что будет потом, так как эта стрелка входит в уже заполненный кружок. Пойдя по этой стрелке, мы потратим 9 сейчас и 0 потом, итого 9. Для второй стрелки (где написано число 2) мы не знаем будущего результата, так как кружок F еще не заполнен. Значит, на данном этапе заполнять кружок C нельзя. C 18 6 F Не заполнен! Не знаем, что будет. G Продолжение таблицы 16 Попробуем заполнить кружок F. Из него выходит всего одна стрелка. И эта стрелка входит в заполненный кружок G. Значит, мы знаем будущий результат: пойдя из F по этой единственной стрелке, мы потратим сразу 6 и потом 0, итого 6. Ставим число 6 в кружок F и помечаем стрелку, которая дала этот результат (в данном случае она единственная). Это число 6 показывает, сколько в лучшем случае нам придется потратить, если мы окажемся в позиции F. B C 18 4 9 5 A D 17 12 12 3 E C 18 4 6 F 14 B 9 5 A D 17 12 E 2 12 3 14 G 2 6 F 6 G Продолжение таблицы 16 Теперь кружок F заполнен, и мы можем определить будущее для обеих стрелок, выходящих из кружка C и заполнить его. Пойдя по стрелке с числом 9 мы потратим сразу 9 и потом 0, итого 9. Пойдя по стрелке с числом 2 мы потратим сразу 2 и потом 6, итого 8. Наименьшие траты равны 8 при движении по стрелке с числом 2. Помечаем эту стрелку как оптимальную в позиции C и записываем лучший для C результат 8 в этот кружок. B C 18 4 9 5 A D 17 12 12 3 E C 8 18 4 5 A D 17 12 14 9 2 12 3 E 6 F 6 14 B G 2 6 F 6 G Продолжение таблицы 16 Какую позицию можно заполнить на следующем этапе? Таких позиций теперь две: это кружки В и D: из B выходит всего одна стрелка в уже заполненный кружок C; из D выходят две стрелки: одна в уже заполненный кружок C, а вторая в заполненный кружок F. В каком порядке будут заполнены эти кружки, безразлично, итоговый результат не поменяется. Покажите самостоятельно, что заполнить кружки A и E на данном этапе нельзя. Заполним сначала кружок B. Пойдя из него по единственной стрелке, потратим сразу 18 и потом 8, то есть всего 26. Записываем это число в кружок B, а стрелку помечаем. B C 8 18 4 5 A D 17 12 4 A 12 5 D 14 9 2 12 3 E C 8 18 17 12 6 F 6 14 B 26 G 2 3 E 9 6 F 6 G Продолжение таблицы 16 Заполним теперь кружок D. Из него выходят две стрелки. Пойдя по стрелке в кружок C, сразу потратим 5 и потом 8, итого 13. Пойдя по стрелке в кружок F, сразу потратим 12 и потом 6, итого 18. Минимальный результат 13 достигается на стрелке DC. Помечаем эту стрелку и записываем результат в D. B 26 4 A 5 D 17 12 A 12 5 D 13 12 3 E 14 6 C 8 18 17 G F 6 14 B 26 9 2 3 E 4 C 8 18 9 2 12 6 F 6 G Теперь можно заполнить кружок E. Из него выходят две стрелки. Пойдя по стрелке в кружок D, сразу потратим 3 и потом 13, итого 16. Пойдя по стрелке в кружок F, сразу потратим 14 и потом 6, итого 20. Минимальный результат 16 достигается на стрелке ED. Помечаем эту стрелку и записываем результат в E. B 26 4 A 5 D 13 17 12 A 12 5 D 13 12 3 E 16 14 6 C 8 18 17 G F 6 14 B 26 9 2 3 E 4 C 8 18 9 2 12 6 F 6 G Продолжение таблицы 16 Наконец, можно заполнить кружок A. Из него выходят три стрелки: AB, AD, AE. Пойдя по стрелке AB, сразу потратим 4 и потом 26, итого 30. Пойдя по стрелке AD, сразу потратим 17 и потом 13, итого 30. Пойдя по стрелке AE, сразу потратим 12 и потом 16, итого 28. Минимальный результат 28 достигается на стрелке AE. Помечаем эту стрелку и записываем результат в A. B 26 4 A 5 D 13 17 12 A 28 12 5 D 13 12 3 E 16 14 6 C 8 18 17 G F 6 14 B 26 9 2 3 E 16 4 C 8 18 9 2 12 6 F 6 G Продолжение таблицы 16 В итоге получаем сетевой график, показанный справа. Для каждой позиции (кружка) нами определены условные оптимумы: число и соответствующая стрелка. Они показывают, какой лучший результат будет получен, при условии, что мы будем двигаться до конца из этого кружка и по какой стрелке нужно двигаться. Бывают случаи, когда для некоторых кружков могут быть помечены несколько стрелок, приводящих к одинаковому оптимальному результату. В таких случаях, в зависимости от смысла задачи, выбирают любую одну из оптимальных стрелок или все из них. B 26 4 A 28 5 17 12 3 E 16 C 8 18 D 13 3 14 9 2 12 6 F 6 G Продолжение таблицы 16 Двигаемся теперь от начальной позиции A по выделенным стрелкам, помечая их более жирной толщиной. Сначала из A перейдем в E, так как в кружке A помечена стрелка AE. Потом из E в D по помеченной ED. B 26 4 A 28 5 17 12 3 E 16 B 26 4 A 28 D 13 3 14 9 G 2 12 6 F 6 C 8 5 3 E 16 D 13 3 14 18 17 12 C 8 18 9 2 12 6 F 6 G Продолжение таблицы 16 Перейдем из D в C по помеченной стрелке DC. Потом пройдем по стрелке CF, затем FD. B 26 4 A 28 5 17 12 3 E 16 B 26 4 A 28 A 28 12 12 9 12 G 6 F 6 C 8 18 5 3 E 16 C 8 14 D 13 3 14 6 2 3 17 G F 6 D 13 B 26 9 2 5 E 16 4 D 13 3 14 18 17 12 C 8 18 9 2 12 6 F 6 G Таким образом, получаем выделенным самый короткий путь на сетевом графике: AEDCFG (рис. 9). Его продолжительность (длина) равна 28. Определение самого длинного пути выполняется аналогично, только при выборе условных оптимумов (оптимальных стрелок и значений) надо отдавать предпочтение самым большим суммарным результатам. B 26 4 A 28 5 17 12 3 E 16 C 8 18 D 13 3 14 9 2 12 6 G F 6 Рис. 9. Сетевой график ОТВЕТ Необходимо двигаться по пути AEDCFG для того, чтобы в данном сетевом графике попасть из A в G по самому короткому пути. Продолжительность (длина) такого пути равна 28. Пример (задача об оптимальном использовании истощаемых и возобновляемых ресурсов): Планируется деятельность двух отраслей производства на п лет. Начальные ресурсы s0. Средства х, вложенные в I отрасль в начале года, дают в конце года прибыль f1 (x) и возвращаются в размере q1 (x) s*1=0,8 s0-0,1x1 =0,8*10000-0,1*0=8000 -> x*2=0, y*2=s*1=8000 (все средства выделяются II отрасли) -> s*2=0,8*8000-0,1*0=6400-> x*3=6400, y*3=s*2=0 (все средства выделяются I отрасли) -> S3=0,8*6400-0,1 *6400=4480 => x*4=4480, y*4=0 (все средства выделяются I отрасли). Оптимальная прибыль за 4 года, полученная от двух отраслей производства при начальных средствах 10000 ед., равна 15528 ед. при условии, что I отрасль получает по годам (0; 0; 6400; 4480), а II отрасль — соответственно (10000; 8000; 0; 0). Пример. Задача о замене оборудования. Замена оборудования — важная экономическая проблема. Задача состоит в определении оптимальных сроков замены старого оборудования (станков, производственных зданий и т. п.). Старение оборудования включает его физический и моральный износ, в результате чего растут производственные затраты, затраты на ремонт и обслуживание, снижаются производительность труда, ликвидная стоимость. Критерием оптимальности являются, как правило, либо прибыль от эксплуатации оборудования (задача максимизации), либо суммарные затраты на эксплуатацию в течение планируемого периода (задача минимизации). При построении модели задачи принято считать, что решение о замене выносится в начале каждого промежутка эксплуатации (например, в начале года) и что в принципе оборудование можно использовать неограниченно долго. Основная характеристика оборудования — параметр состояния — его возраст t. При составлении динамической модели замены процесс замены рассматривают как ≪-шаговый, разбивая весь период эксплуатации на п шагов. Возможное управление на каждом шаге характеризуется качественными признаками, например, Xс (сохранить оборудование), Xз (заменить) и Хр (сделать ремонт). Рассмотрим конкретный пример. Пример: Оборудование эксплуатируется в течение 5 лет, после этого продается. В начале каждого года можно принять решение сохранить оборудование или заменить его новым. Стоимость нового оборудования р 0=4000 руб. После t лет эксплуатации (1< t<5) оборудование можно продать за g(t)=p02-t рублей (ликвидная стоимость). Затраты на содержание в течение года зависят от возраста t оборудования и равны г(t)=600(t+1). Определить оптимальную стратегию эксплуатации оборудования, чтобы суммарные затраты с учетом начальной покупки и заключительной продажи были минимальны. Решение. Способ деления управления на шаги естественный, по годам, п = 5. Параметр состояния — возраст машины — Sk-1=t, s0=0 — машина новая в начале первого года эксплуатации. Управление на каждом шаге зависит от двух переменных Xc и X3. Уравнения состояний зависят от управления: 134 c  t  1, если Х k  X Sk=  (1) з  1 , если Х  X , k  1 , 2 , 3 , 4  k В самом деле, если к k-му шагу sk-1, то при сохранении машины ( Х k  Xc ) через год возраст машины увеличится на 1. Если машина заменяется новой ( Х k  X з ), то это означает, что к началу k-гo шага ее возраст t=0, а после года эксплуатации t= 1, т.е. sk— 1. Показатель эффективности k-го шага: c  600( t  1), если Х k  X f k  (X k , t )   , k  1,2,3,4 (2) t з  4600  4000 * 2 , если Х k  X (При Xc затраты только на эксплуатацию машины возраста t, при X3 машина продается (-4000-2-t), покупается новая (4000) и эксплуатируется в течение первого года (600), общие затраты равны (-4000-2-t+4000+600)). Пусть Zk(t) — условные оптимальные затраты на эксплуатацию машины, начиная с k-гo шага до конца, при условии, что к началу k-го шага машина имеет возраст t лет. Запишем для функций Z*k (t) уравнения Беллмана и, заменив задачу максимизации на задачу минимизации: ( t 1)  если Х 5  X c 600( t  1)  4000 * 2 * Z 5= min  (3) t ( t 1) з  4600  4000 * 2  4000 * 2 , если Х  X 5  Величина 4000 * 2 ( t 1) — стоимость машины возраста t лет (по условию машина после 5 лет эксплуатации продается). * c  600( t  1)  Z k 1 ( t  1), если Х k  X * , k  4,3,2,1 (4) Z k= min  t * з  4600  4000 * 2  Z k 1 1, если Х k  X Из определения функций Z*k(t) следует Zmin=Z*1(0) Дадим геометрическое решение этой задачи. На оси абсцисс будем откладывать номер шага k, на оси ординат — возраст t машины. Точка (k-1, t) на плоскости соответствует началу k-го года эксплуатации машины возраста t лет. Перемещение на графике в зависимости от принятого управления на k-м шаге показано на рис.1. Xc 600(t+1) k, t+1 k-1, t 4600-4000*2-t Xз k, 1 135 Над каждым отрезком, соединяющим точки (k-1; t) и (k; t+l), запишем соответствующие управлению Xc затраты, найденные из (2): 600(t+1), а над отрезком, соединяющим точки (k-1;t) и (k, t), запишем затраты, соответствующие управлению X3, т.е. 4600-4000-2-t . Таким образом мы разметим все отрезки, соединяющие точки на графике, соответствующие переходам из любого состояния sk-1 в состояние sk (рис. 2). Проведем на размеченном графе состояний (см. рис. 2) условную оптимизацию. V шаг. Начальные состояния — точки (4; t), конечные (5; t). В состояниях (5; t) машина продается, условный оптимальный доход от продажи равен 40002-t, но поскольку целевая функция связана с затратами, то в кружках точек (5; t) поставим величину дохода со знаком минус. Анализируем, как можно попасть из каждого начального состояния в конечное на V шаге. Состояние (4; 1). Из него можно попасть в состояние (5; 2), затратив на эксплуатацию машины 1200 и выручив затем от продажи 1000, т.е. суммарные затраты равны 200, и в состояние (5; 1) с затратами 2600-2000=600. Значит, если к последнему шагу система находилась в точке (4; 1), то следует идти в точку (5; 2) (укажем это направление двойной стрелкой), а неизбежные минимальные затраты, соответствующие этому переходу, равны 200 (поместим эту величину Z*5 (1)=200 в кружке точки (4; 1). Состояние (4; 2). Из него можно попасть в точку (5; 3) с затратами 1800-500=1300 и в точку (5; 1) с затратами 3600-2000=1600. Выбираем первое управление, отмечаем его двойной стрелкой, а Z*4 (2)=1300 проставляем в кружке точки (4; 2). Рассуждая таким же образом для каждой точки предпоследнего шага, мы найдем для любого исхода IV шага оптимальное управление на V шаге, отметим его на рис. 2 двойной стрелкой. Далее планируем IV шаг, анализируя каждое состояние, в котором может оказаться система в конце III шага с учетом оптимального продолжения до конца процесса, т.е. решаем для всех 0 < t < 4 при k=4 уравнения (1). Например, если начало IV шага соответствует состоянию (3; 1), то при управлении Xc система переходит в точку (4; 2), затраты на этом шаге 1200, а суммарные затраты за два последних шага равны 1200+1300=2500. При управлении X3 затраты за два шага равны 2600+200=2800. Выбираем минимальные затраты 2500, ставим их в кружок точки (3; 1), а соответствующие управления на этом шаге помечаем двойной стрелкой, ведущей из состояния (3; 1), в состояние (4; 2). Так поступаем для каждого состояния (3; t) (см. рис. 2). Продолжая условную оптимизацию III, II и I шагов, мы получим на рис. 12.8 следующую ситуацию: из каждой точки (состояния) выходит стрелка, указывающая, куда следует перемещаться в данном шаге, если система оказалась в этой точке, а в кружках записаны минимальные затраты на переход из этой точки в конечное состояние. На каждом шаге графически решались уравнения (1). 136 После проведения условной оптимизации получим в точке (0; 0) минимальные затраты на эксплуатацию машины в течение 5 лет с последующей продажей: Zmin= 11900. Далее строим оптимальную траекторию, перемещаясь из точки ,s0(0; 0) по двойным стрелкам. Получаем набор точек: {(0; 0), (1; 1), (2; 2), (3; 1), (4; 2), (5; 3)}, который соответствует оптимальному управлению X* (Xc, Xc, X3, Xc, Xc). Оптимальный режим эксплуатации состоит в том, чтобы заменить машину новой в начале 3-го года. Таким образом, размеченный график (сеть) позволяет наглядно интерпретировать расчетную схему и решить задачу методом ДП. Как уже отмечалось, модели и вычислительная схема ДП очень гибки в смысле возможностей включения в модель различных модификаций задачи. Например, аналогичная задача может быть рассмотрена для большого числа вариантов управления, "ремонт", "капитальный ремонт" и т. д. 137 ОПТИМИЗАЦИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Модель игры с природой: основные понятия и варианты постановок статистических игр Игра с природой моделирует ситуацию, в которой два участника. Один из участников – человек или группа лиц с общей осознанной целью. Этот игрок называется статистик, его стратегиям мы будем сопоставлять строки матрицы результатов и обозначать их, как правило, Ci или аббревиатурой, соответствующей смыслу задачи. Второй участник – комплекс внешних условий, при которых статистику приходится принимать решение. Этого «игрока» называют природа. Состояния-стратегии природы будем обозначать чаще всего П j или осмысленной аббревиатурой. Природа безразлична к выигрышу и не стремится обратить ситуацию в свою пользу. Пусть у статистика имеется m возможных стратегий C1, C2 ,..., Cm ; природа может реализовать n различных состояний П1, П2 ,..., Пn . Какое состояние природы будет реализовано в конкретном случае заранее неизвестно. Однако в некоторых случаях могут быть известны вероятности реализаций этих состояний. Возможны три варианта постановки игры с природой. 1. Вероятности состояний природы известны, и они зависят от того, какую стратегию выберет статистик. В этом случае для каждой ячейки таблицы кроме результата для статистика aij мы знаем параметр pij – вероятность того, что реализуется состояние природы П j при условии, что статистик выберет стратегию Ci . Эти вероятности записывают в ту же ячейку таблицы, как правило, по диагонали от результата. Сумма вероятностей состояний природы в каждой строке равна единице: pi1  pi 2   pin  1. Пример. Правительство рассматривает варианты вложения средств резервного фонда. Возможные варианты: краткосрочные облигации иностранного государства, валюта, инвестиции в промышленность. Результат операции зависит от экономической ситуации: курс валюты может расти или падать, может быть разный уровень инфляции и т.д. Очевидно, что вероятность той или иной ситуации зависит от выбора варианта вклада. Отметим, зависят именно вероятности развития той или иной ситуации, сама же экономическая ситуация остается неопределенной (так как на нее влияют многие другие причины). В этом случае игру задают в виде таблицы с двумя значениями в каждой внутренней ячейке. Одно значение соответствует выигрышу статистика при 138 выбранной им стратегии и сложившемся состоянии природы, а второе – вероятности данного состояния природы при выбранной им стратегии. Вероятности записывают обычно меньшим шрифтом сверху или снизу ячейки (см. Табл.1). Таблица 1. Игра с природой при известных вероятностях состояний природы, зависящих от выбора статистика П1 Пj П2 Пn C1 a11 p11 a12 p12 a1 j p1 j a1n p1n C2 a21 p21 a22 p22 a2 j p2 j a2n p2 n Ci ai1 pi 1 ai 2 pi 2 aij pij ain pin Cm am1 p m1 am 2 pm 2 amj pmj amn pmn 2. Вероятности состояний природы известны, и они не зависят от того, какую стратегию выберет статистик. В этом случае мы знаем параметры p j – вероятности того, что реализуется состояние природы П j и они не зависят от того, какая стратегия Ci выбрана. Эти вероятности записывают в таблицу в отдельную строку сверху или снизу строк результатов. Сумма вероятностей всех состояний природы равна единице: p1  p2   pn  1. Очевидно, что этот вариант является частным случаем первого варианта, при котором все значения вероятностей в одном столбце равны: p1 j  p2 j   pmj  p j . Примером такой ситуации является выбор варианта вложения избыточных средств предпринимателем. Возможные варианты: валюта, ГКО, развитие производства. Несмотря на схожесть ситуации с прошлым примером, очевидно, что относительно небольшой вклад предпринимателя не повлияет на экономическую ситуацию в целом. В этом случае вероятности развития той или иной ситуации на рынке не зависят от выбора статистика. В этом случае игру задают в виде таблицы только со значениями выигрыша статистика при выбранной им стратегии и сложившемся состоянии природы. Вероятности состояний природы (которые в этом случае едины для всего столбца) записывают отдельной строкой внизу или вверху таблицы. Эту строку обозначают, как правило Pj (см. Табл.2) 139 Таблица 2. Игра с природой при известных вероятностях состояний природы, не зависящих от выбора статистика П1 П2 Пj Пn C1 a11 a12 a1 j a1n C2 a21 a22 a2 j a2n Ci ai1 ai 2 aij ain Cm am1 am 2 amj amn Pj p1 p2 pj pn 3. Вероятности состояний природы неизвестны. В этом случае игру задают в виде таблицы только со значениями выигрыша статистика при выбранной им стратегии и сложившемся состоянии природы. Вероятности состояний природы нигде не указывают: Таблица 3. Игра с природой при неизвестных вероятностях состояний природы П1 П2 Пj Пn C1 a11 a12 a1 j a1n C2 a21 a22 a2 j a2n Ci ai1 ai 2 aij ain Cm am1 am 2 amj amn В качестве примера приведем такую ситуацию. Предприниматель планирует участвовать в обеспечении народных гуляний, которые намечены на 30 августа, питанием. Он должен заблаговременно закупить оборудование: холодильники для мороженого или бойлеры для горячего чая, заказать или не заказывать тенты для своих кафе и т.п. Очевидно, что оптимальный выбор оборудования зависит от погоды (жарко или холодно, солнечно или дождливо) в день гуляний. Заранее оценить вероятность погоды в конкретный день в конце лета представляется крайне проблематичным. Общая статистика предыдущих лет, дающая неплохие результаты для больших временных промежутков очень плохо «срабатывает» для одного конкретного дня. 140 Для выбора оптимальной стратегии в игре с природой мы будем использовать несколько критериев. Знание вероятностей необходимо лишь в одном из них. Для его использования в третьем варианте применяется правило неопределенности (принцип недостаточного основания) Лапласа, когда все состояния считаются равновероятными: p1  p2   pn  1 n . В таком случае эта постановка также является частным случаем 1 варианта. Игру с природой, как и матричную игру, можно упростить учитывая доминирование стратегий. Однако есть принципиальное отличие. В игре с природой можно отбрасывать только заведомо невыгодные (относительно других) стратегии статистика. При упрощении платежной матрицы нельзя отбрасывать никакие состояния природы, т.к. природа может реализовать любое из своих состояний независимо от того, выгодно это статистику или нет. Рассмотрим несколько критериев выбора оптимальных стратегий при игре с природой. Каждый критерий наилучшим образом соответствует своей ситуации принятия решения и индивидуальным особенностям лица, принимающего решения. Вместе с тем возможно и использование совокупности нескольких критериев. Важно отметить, что выбор оптимальных стратегий исключительно математическими методами, как правило, не производится. Тем не менее, эти методы дают возможность выделить из большого числа возможных вариантов наиболее предпочтительные, которые в дальнейшем необходимо анализировать с привлечением более сложных (например, экспертных или экспериментальных) методик. При смешиваемости стратегий Статистика результаты анализа позволяют наметить оптимальные пропорции долей использования лучших стратегий. В данном пособии будут рассматриваться задачи с небольшим количеством возможных стратегий статистика. Для целей освоения методов оценивания в качестве ответа к играм с природой договоримся записывать ту стратегию, которая чаще всего будет определяться как лучшая в отдельных критериях. В данном пособии буквенные обозначения параметров в критериях будут соответствовать латинским буквам их названий. Критерии выбора решений в условиях неопределенности Все критерии продемонстрируем на игре с природой, соответствующей первому варианту постановки, как более общему. Применение критериев рассмотрим на следующем примере. Фирма Исполнитель выполняет и сдает проект. На этапе выполнения возможны следующие стратегии: C1 – выполнение собственными силами; C2 – привлечение 141 только научных консультантов; C3 – привлечение только финансовых консультантов; C4 – привлечение научных и финансовых консультантов. Результат сдачи проекта зависит от требовательности Заказчика, который может: П1 – не проводить экспертиз; П2 – провести только научную экспертизу; П3 – провести научную и экономическую экспертизу; экономическая экспертиза без научной не проводится. Чем больше проверок проекта, тем меньший финансовый результат можно ожидать, особенно, если не были привлечены соответствующие эксперты (из-за устранения несоответствий, переносов сроков сдачи и т.п.). Однако и привлечение консультантов влечет дополнительные затраты. Известно, что Заказчик имеет некоторую степень доверия к консультантам и при их привлечении вероятность соответствующей проверки снижается. Заметим, что Заказчик в этой ситуации не имеет заинтересованности в финансовом результате работы Исполнителя и может рассматриваться как Природа. Несмотря на свою осознанность, он имеет свои собственные интересы – качественный результат выполнения заказа, сроки выполнения и т.п. Эти интересы слабо коррелируют с доходом Исполнителя, т.к. общая стоимость работ обычно оговаривается заранее. Пусть финансовый результат для Исполнителя (в млн. руб.) и вероятности проверок Заказчика могут быть оценены заранее и сведены в таблицу игры с природой (см. Таблицу 4). Таблица 4. Игра с природой для примера Исполнитель – Заказчик П1 C1 C2 C3 C4 10 7 9 6 0,3 0,6 0,5 0,8 П2 5 6 4 6 0,3 0,1 0,4 0,1 П3 2 4 3 5 0,4 0,3 0,1 0,1 Рассмотрим несколько значений в ячейках таблицы. Значения 10 и 0,3 в ячейке C1 П1 показывают, что если Исполнитель выполнит проект самостоятельно, а Заказчик не будет организовывать проверок, то Исполнитель получит 10 млн. руб. Вероятность того, что Заказчик не будет организовывать проверку, если Исполнитель выполнил работу самостоятельно, равна 0,3 или 30%. Если же в этом случае Заказчик организует обе проверки (ячейка C1 П3 ), то финансовый результат фирмы-исполнителя падает до 2 млн. руб. из-за необходимости значительной доработки проекта. Вероятность такого события при самостоятельном выполнении работ равна 0,4 или 40%. 142 Значения 5 и 0,1 в ячейке C4 П3 показывают, что если Исполнитель привлечет к проекту научных и финансовых консультантов, то при организации обеих проверок Исполнитель получит уже 5 млн. руб., так как проект будет выполнен с учетом многих требований. Вероятность того, что Заказчик будет организовывать обе проверки в этом случае равна 0,1 или 10%. Если же в этом случае Заказчик не будет организовывать экспертной проверки вовсе (вероятность чего очень велика и равна 0,8 или 80%), то выигрыш фирмы-исполнителя составит только 6 млн. руб., а не 10, так как велики будут расходы на привлечение консультантов. Критерий наилучшего среднего результата Байеса-Лапласа В этом критерии для каждой стратегии (строки) определяется средний ожидаемый результат как сумма произведений вдоль строки результатов на их вероятности: Bi  pi1  ai1  pi 2  ai 2   pin  ain Лучшей по критерию Байеса считается та стратегия, для которой этот результат наибольший: BI  max Bi  CI  The best (Bayes) i Место критерия Байеса. Как следует из сути и альтернативных названий этого критерия, он наилучшим образом соответствует ситуации многократной повторяемости, когда лучший средний результат приведет к лучшему общему итогу. Если рассматриваемая ситуация выбора решения будет часто повторяться при неизменных условиях, то выбор наилучшей стратегии по критерию Байеса представляется наилучшим. В остальных случаях этот критерий разумно использовать лишь как ориентировочный. Отметим, что только в этом критерии используются значения вероятностей состояний. В остальных критериях используются только значения выигрышей. Применим критерий Байеса к нашему примеру. B1  0,3  10  0,3  5  0,4  2  5,3 B2  0,6  7  0,1  6  0,3  4  6,0 B3  0,5  9  0,4  4  0,1  3  6,4 B4  0,8  6  0,1  6  0,1  5  5,9 BI  max(5,3; 6,0; 6,4; 5,9)  6,4  B3  C3  The best (Bayes) Таким образом, по критерию Байеса наилучшей является стратегия C3 , то есть средний лучший результат приносит стратегия привлечения только финансовых консультантов. 143 Если фирма-исполнитель постоянно выполняет аналогичные проекты для схожих заказчиков, то общий результат деятельности будет наилучшим при выборе именно третьей стратегии. Если такой заказ имеет разовый характер, то критерий Байеса является менее предпочтительным. Принцип гарантированного результата Вальда (метод пессимизма) В этом критерии для каждой стратегии (строки) определяется наименьший достижимый результат как минимальный элемент в строке: Wi  min  aij   min  aij  строка j Лучшей по критерию Вальда считается та стратегия, для которой этот результат наибольший: WI  max Wi  CI  The best (Wald) i Место критерия Вальда. Как следует из сути и альтернативных названий этого критерия, он наилучшим образом подходит для ситуации, в которой необходимо получить наименее «плачевный» результат в самом худшем случае, максимум минимального дохода или минимум максимальных потерь. Критерий соответствует пессимистично настроенному лицу, принимающему решения, когда для него страх проигрыша значительно важнее выигрыша. Выбирая стратегию по критерию Вальда мы можем твердо рассчитывать на полученный при ее определении результат даже при самом плохом стечении обстоятельств. Применим критерий Вальда к нашему примеру. W1  min 10; 5; 2   2 W2  min  7; 6; 4   4 W3  min  9; 4; 3  3 W4  min  6; 6; 5   5 WI  max(2; 4; 3; 5)  5  W4  C4  The best (Wald) Таким образом, по критерию Вальда наилучшей является стратегия C4 , то есть при привлечении научных и финансовых консультантов мы в самом худшем случае получим наибольший выигрыш. Критерий оптимизма и компромиссный критерий Гурвица Критерий оптимизма (максимакса, крайнего оптимизма) В этом критерии для каждой стратегии (строки) определяется наибольший достижимый результат как максимальный элемент в строке: Oi  max  aij   max  aij  строка j 144 Лучшей по критерию оптимизма считается та стратегия, для которой этот результат наибольший: OI  max Oi  CI  The best (optimism) i Место критерия оптимизма. Как следует из сути и названий этого критерия, он наилучшим образом подходит для ситуации, в которой игрок настроен крайне оптимистично и рассчитывает на наибольший успех. Критерий хорошо работает в случае, когда потери для игрока в рассматриваемой ситуации мало значимы. Он так же соответствует случаю, когда все стратегии во всех вариантах приводят к заметным выигрышам и можно «рискнуть» понадеяться на самый крупный из них. Результат применения этого критерия бывает обычно заранее понятным. Как правило, этот критерий для анализа игр с природой не используется, а используется более «взвешенный» критерий Гурвица. Применим критерий оптимизма к нашему примеру. O1  max 10; 5; 2   10 O2  max  7; 6; 4   7 O3  max  9; 4; 3  9 O4  max  6; 6; 5   6 OI  max(10; 7; 9; 6)  10  O1  C1  The best (optimism) Таким образом, по критерию оптимизма наилучшей является стратегия C1 , то есть наибольший возможный выигрыш есть шанс получить только выполняя проект своими силами без привлечения консультантов. Критерий Гурвица (Hurwich) (пессимизма-оптимизма, компромиссный) В этом критерии для каждой стратегии определяется «взвешенный» результат из самого пессимистического и самого оптимистического для данной стратегии. Вес каждого определяется так называемыми коэффициентами пессимизма и оптимизма, сумма которых равна единице. Обычно в задаче задается лишь коэффициент пессимизма k (или  , или  , или ϰ). Коэффициент оптимизма равен, соответственно, 1  k  . Значение этого коэффициента определяется личными особенностями лица, принимающего решения в данной ситуации и никак не зависит от вида самой матрицы. После задания коэффициента пессимизма k и коэффициента оптимизма 1  k  для каждой стратегии находят пессимистический вариант Bi и оптимистический вариант Oi и вычисляют параметр Гурвица: Hi  k  Wi  1  k   Oi 145 Лучшей по критерию Гурвица считается та стратегия, для которой этот результат наибольший: H I  max Hi  CI  The best (Hurwich) i Место критерия Гурвица. Данный критерий является компромиссным между прошлыми двумя и служит для учета как лучших, так и худших вариантов стратегий. Варианты применения критерия Гурвица. В некоторых случаях считается разумным вместо лучшего (худшего) вариантов использовать средний результат между несколькими лучшими (худшими) значениями. Встречаются случаи, когда для критерия Гурвица используют лучшее (худшее) значение, вероятность которого не меньше заданной величины. Тем самым отсекаются крайне редко реализуемые предельные значения. Для решения задач будем использовать критерий Гурвица в классической постановке, а коэффициент пессимизма будем задавать явно в условии задачи. Применим критерий Гурвица к нашему примеру. Коэффициент пессимизма возьмем равным k  0,6 . Тогда коэффициент оптимизма равен 1  k   1  0,6  0,4 . H1  0,6  2  0,4  10  5,2 H 2  0,6  4  0,4  7  5,2 H 3  0,6  3  0,4  9  5,4 H 4  0,6  5  0,4  6  5,4 H I  max(5,2; 5,2; 5,4; 5,4)  5,4  H3 , H 4  C3 , C4  The best (Hurwich) Таким образом, по критерию Гурвица наилучшими оказались две стратегии: C3 и C4 , то есть по этому критерию предпочтительно привлекать научных и финансовых консультантов или только финансовых консультантов. Критерий минимизации риска Сэвиджа В этом критерии сначала строится матрица (таблица) рисков. Алгоритм построения матрицы такой. 1) Матрица рисков строится по столбцам. 2) В каждом столбце находим самое большое значение выигрыша. 3) Из этого значения по очереди вычитают все значения в данном столбце и записывают результат в те же позиции. Символьно эту процедуру можно записать в таком виде: rij  max aij  aij столб Построим матрицу рисков в нашем примере. 146 Максимальный элемент в первом столбце исходной матрицы равен 10. Вычитая из 10 остальные элементы столбца, получим: 10  10  0  0 10  7  3      , то есть первый столбец матрицы рисков равен  3  10  9  1  1      10  6  4   4 Аналогично находим элементы других столбцов:  6  5  1  1   5  2  3  3  6  6  0 0  5  4  1  1     ,   . 6  4  2  2 5  3  2  2         6  6  0 0 5  5  0 0 Таким образом, матрица рисков для нашего примера будет иметь вид: 0 3 rij   1  4   1 3 0 1  . 2 2  0 0 Экономический смысл матрицы рисков. Элементы матрицы рисков показывают каково «недополучение» оптимальной прибыли из-за неверного выбора стратегии при данном состоянии природы. Например, элемент «4» показывает, что если Исполнитель привлекает обоих экспертов, то в случае отсутствия проверки он недополучает 4 млн. руб. относительно максимально возможных при отсутствии проверки 10 млн. руб. Далее в каждой строке матрицы рисков определяется наибольший результат (максимальный элемент в строке): Si  max  rij   max  rij  строка j Лучшей по критерию Сэвиджа считается та стратегия, для которой этот результат наименьший: S I  min Si  CI  The best (Savage) i Место критерия Сэвиджа. Риск аналогичен отставанию. Таким образом, данный критерий наиболее соответствует ситуации, в которой игроку важнее не отстать от конкурентов, находящихся в аналогичных условиях, нежели много выиграть или как можно меньше проиграть. Применим критерий Сэвиджа к примеру: 147 S1  max  0; 1; 3  3 S2  max  3; 0; 1  3 S3  max 1; 2; 2   2 S4  max  4; 0; 0   4 SI  min(3; 3; 2; 4)  2  S3  C3  The best (Savage) Таким образом, по критерию Сэвиджа наилучшей является стратегия C3 , то есть при привлечении только финансовых консультантов мы рискуем потерять наименьшее значение относительно других возможных вариантов. Запись ответа в задачах игры с природой Выпишем оптимальные результаты по разным критериям: C3  The best (Bayes) C4  The best (Wald) C1  The best (optimism) C3 , C4  The best (Hurwich) C3  The best (Savage) Лучший вариант записи ответа: выбор стратегии по критерию, наилучшим образом соответствующему управленческой ситуации с соответствующим обоснованием. В нашем примере ответ может быть записан, например, так: Вариант ответа 1: так как наша ситуация постоянно повторяется, то мы заинтересованы получить наибольший средний результат, соответственно выбираем стратегию по критерию Байеса. Будем использовать C3 – привлекать к выполнению работ только финансовых консультантов. Как видно, она является неплохой и по ряду других критериев. Или так: Вариант ответа 2: так как наше руководство очень пессимистично настроено, то будем выбирать стратегию по критерию пессимизма – Вальда. Будем использовать C4 – привлекать к выполнению работ только научных и финансовых консультантов. Формальный вариант записи ответа: при решении учебных задач, особенно без ситуативной постановки, в качестве ответа формально будем записывать ту стратегию, которая чаще всего выделяется как лучшая по перечисленным критериям. 148 Ответ формальный: Как видно, стратегия C3 чаще всего встречается в лучших результатах. Она и будет записана нами в ответ как самая оптимальная. Выбираем вариант привлечь к выполнению работ только финансовых консультантов. Понятие о цене информации в игре с природой В игре с природой часто возникает возможность получения информации или уточнения данных о реализации состояний природы. Такая информация «предоставляется» не «бесплатно» – для ее получения необходимо затратить определенные усилия, вложить средства и т.п. Встает вопрос о максимальной «цене» такой информации. Сколько мы можем «заплатить» за информацию, чтобы выигрыш при обладании ей за вычетом платы за информацию был не меньше выигрыша без учета этой информации? При этом необходимо сравнивать, очевидно, случаи оптимального поведения при дополнительной информации и без нее. Проще всего данный вопрос осветить на примере игры с природой, имеющей частые повторения (партии) в одинаковых условиях. В этом случае для выбора оптимальной стратегии предпочтительно использовать критерий Байеса. В качестве примера рассмотрим следующую ситуацию. Коммерсант ежедневно возит молочную продукцию на своем автомобиле для продажи в дачном поселке. Он закупает молоко ящиками по 20 бутылок по мелкооптовой цене 20 рублей за бутылку и продает в розницу по 35 рублей за бутылку. За день может быть реализовано от 1 до 5 ящиков. Так как в автомобиле нет холодильника, то все нереализованное молоко портится и выбрасывается. По предварительным опросам дачников, коммерсант делает предположение о вероятностях спроса: спрос в 1 ящик имеет вероятность 10%, в 2 ящика – 20%, в 3 ящика – 30%, в 4 ящика – 30%, в 5 ящиков – 10% (для простоты рассмотрения будем считать, что ежедневно продается целое количество ящиков молока). Таким образом, ежедневно коммерсант должен принять решение, сколько ящиков молока закупить и привезти на продажу. Запишем матрицу игры с природой для этой задачи. Выигрышем будем считать прибыль, которую получит коммерсант в каждой ситуации. Строки матрицы будут соответствовать возможным стратегиям коммерсанта – купить 1, 2, 3, 4 или 5 ящиков. Столбцы будут соответствовать спросу на молоко: 1, 2, 3, 4 или 5 ящиков. Матрица игры с природой будет иметь вид, представленный в табл. 5. Поясним, как получились значения в таблице. Как следует из условия, при покупке одного ящика коммерсант тратит 400 руб., а при продаже получает 149 700 руб. Таким образом, каждый проданный ящик приносит прибыль 300 руб., а каждый пропавший приносит убыток 400 руб. (то есть прибыль минус 400 руб.). Рассмотрим ситуацию, когда коммерсант привез 4 ящика. Если спрос равен 4 ящикам, то прибыль будет равна 1200 руб. При спросе 3 ящика прибыль составит 500 руб. Для спроса 2 ящика получаем убытки 200 руб. (результат игры равен – 200). Для спроса 1 ящик результат равен – 900 руб. Если же спрос равен 5 ящикам, то продается только 4, так как больше товара нет, и спрос остается неудовлетворенным. В этом случае, как и при спросе, равном 4, результат игры равен 1200 руб. Для других вариантов завоза результаты получаются аналогично. Таблица 5. Игра с природой для примера Исполнитель – Заказчик Спрос Закупка 1 ящ. 2 ящ. 3 ящ. 4 ящ. 5 ящ. Вероятности Pj 1 ящ. 2 ящ. 3 ящ. 4 ящ. 5 ящ. 300 – 100 – 500 – 900 – 1300 0,1 300 600 200 – 200 – 600 0,2 300 600 900 500 100 0,3 300 600 900 1200 800 0,3 300 600 900 1200 1500 0,1 Если другой информации у коммерсанта нет, то ему лучше применять для выбора стратегии критерий Байеса – в этом случае он сможет оптимизировать среднюю прибыль и добиться наилучшего результата за многодневный период торговли. B1  0,1  300  0,2  300  0,3  300  0,3  300  0,1  300  300 B2  0,1   100   0,2  600  0,3  600  0,3  600  0,1  600  530 B3  0,1   500   0,2  200  0,3  900  0,3  900  0,1  900  620 B4  0,1   900   0,2   200   0,3  500  0,3  1200  0,1  1200  500 B5  0,1   1300   0,2   600   0,3  100  0,3  800  0,1  1500  170 BI  max(300; 530; 620; 500; 170)  620  B3  C3  The best (Bayes) Таким образом, лучше возить по 3 ящика молока. Тогда средняя дневная прибыль составит 620 рублей. Рассмотрим две возможности дополнительной информации: 150 1. Имеется возможность знать состояние природы перед каждой следующей партией в игре. В данном случае – знать спрос на следующий день (например, можно провести мониторинг спроса на следующий день, организовать продажи по записи и т.п.). 2. Имеется возможность уточнить значения вероятностей состояний природы (например, собрать информацию об аналогичных объектах, провести подробное изучение спроса и т.п.). Описанные возможности требуют дополнительных затрат средств и времени. Каковы максимально допустимые удельные затраты (затраты в пересчете на один день торговли)? Изучим первую возможность. Если коммерсант будет точно знать спрос на следующий день, то он привезет оптимальное количество молока – ровно столько ящиков, сколько будет закуплено. При этом прибыль составит по 300 руб. с 1 ящика, 600 руб. с 2-х, 900 руб. с 3-х, 1200 руб. с 4-х и 1500 руб. с 5-ти ящиков. Так как знание спроса не влияет на частоту его реализации, то 1 ящик он будет возить 10% дней, 2 ящика – 20%, 3 ящика – 30%, 4 ящика – 30% и 5 ящиков – 10%. В итоге коммерсант получит среднюю прибыль, равную:   0,1 300  0,2  600  0,3  900  0,3 1200  0,11500  930 руб. Таким образом, владея информацией о спросе, коммерсант увеличил свою среднюю прибыль на 310 руб. в день. Именно это и есть удельная стоимость точной информации о спросе. Важно заметить, что в результате получения информации коммерсант принципиально поменял свою деятельность: вместо ежедневного завоза по 3 ящика молока он должен возить различное количество, строго определенное дополнительной информацией. Изучим второй вид дополнительной информации. Представим, что у коммерсанта имеется противоречивая информация о вероятностях спроса. Первая версия описана выше (0,1; 0,2; 0,3; 0,3; 0,1). По второй версии спрос равновероятен, то есть вероятность спроса равна 0,2 для всех вариантов. Третьи источники утверждают, что спрос в 1, 2, 3, 4 и 5 ящиков имеет вероятности соответственно 0,1; 0,1; 0,1; 0,4; 0,3. Если мы можем провести серию мероприятий по уточнению этой информации, то какова максимальная удельная стоимость таких мероприятий? Оптимальный выбор стратегии при первом варианте мы уже сделали – нужно возить по 3 ящика и получим в среднем 620 руб. в день. 151 Для второго варианта вероятностей: B1  0,2  300  0,2  300  0,2  300  0,2  300  0,2  300  300 B2  0,2   100   0,2  600  0,2  600  0,2  600  0,2  600  460 B3  0,2   500   0,2  200  0,2  900  0,2  900  0,2  900  480 B4  0,2   900   0,2   200   0,2  500  0,2  1200  0,2  1200  360 B5  0,2   1300   0,2   600   0,2  100  0,2  800  0,2  1500  100 BI  max(300; 460; 480; 360; 100)  480  B3  C3  The best (Bayes) Несмотря на то, что среднее значение прибыли заметно изменилось, выбор стратегии не поменялся. Можно сделать вывод, что уточнение между первым и вторым вариантами вероятностей состояний ничего не стоит. (Это справедливо лишь для поставленной цели определения количества завозимого ежедневно молока. Если же главной целью является оценка рентабельности бизнеса, то цена такой информации может быть совсем ненулевой. Подумайте, почему?). Для третьего варианта вероятностей: B1  0,1  300  0,1  300  0,1  300  0,4  300  0,3  300  300 B2  0,1   100   0,1  600  0,1  600  0,4  600  0,3  600  530 B3  0,1   500   0,1  200  0,1  900  0,4  900  0,3  900  690 B4  0,1   900   0,1   200   0,1  500  0,4  1200  0,3  1200  780 B5  0,1   1300   0,1   600   0,1  100  0,4  800  0,3  1500  590 BI  max(300; 530; 690; 780; 590)  780  B4  C4  The best (Bayes) В данном случае лучше возить по 4 ящика молока и получим в среднем 780 руб. в день прибыли. То есть такая информация побуждает нас сменить решение. Однако посмотрим, сколько же стоит информация с учетом «разумности» нашего поведения при потенциальной возможности первого или третьего вариантов распределения. Предполагая возможность всех вариантов распределения (а не точную уверенность в одном из них), коммерсант находится в дилемме выбора между 3 и 4 ящиками. Выбрав 4 ящика, в первом случае он получит 500 руб. в день вместо 620 (потеря 120 руб.). Во втором случае он получит 360 руб. вместо 480 (потеря 120 руб.). Выбрав же 3 ящика при третьей возможности вероятностей, он получит 690 руб. вместо 780 (потеря 90 руб.). Таким образом, минимальная потеря достигается выбором 3 ящиков и равна 90 рублям. Это и есть максимальная удельная цена данного уточнения. 152 Интересно заметить, что, оценивая разные варианты, мы фактически применили критерий Сэвиджа к новой матричной игре, в которой состояниями природы являются уже варианты распределения вероятностей, а результатами – средние результаты при данных вероятностях: Таблица 6. Вторичная игра с природой для оценивания результатов при разных распределениях вероятностей Вероятности Закупка 1 ящ. 2 ящ. 3 ящ. 4 ящ. 5 ящ. 0,1;0,2;0,3;0,3;0,1 0,2;0,2;0,2;0,2;0,2 0,1;0,1;0,1;0,4;0,3 300 530 620 500 170 300 460 480 360 100 300 530 690 780 590 Максимальная удельная стоимость информации в таком случае оказалась равна минимаксу матрицы рисков для такой игры: max  320 180 480   90 20 250    r  0 90    120 120    450 380 190    480 250 90  min 120 450 Заметим, что все приведенные рассуждения справедливы в предположении, что, уточняя информацию о вероятностях, мы получим один из известных вариантов распределения. Таким образом, выбирая решение без точной информации, мы все же учитывали ее потенциальные возможности. Получение же неожиданного нового варианта распределения считалось невозможным. Оценка стоимости информации о вероятностях состояний природы без фиксации предварительных вариантов – гораздо более сложная задача. В общем случае можно определить стоимость информации так: стоимость точной информации не может превышать разницу выигрышей, полученную за счет изменения стратегии в результате обладания данной информацией относительно лучшего варианта стратегии при рассмотрении всех возможных вариантов как потенциально реализуемых. 153 Модель дерева решений. Элементы принятия решения (вершины решения) и случайного выбора (вершины-вероятности) в модели дерева решений Дерево решений – это графическое изображение последовательности решений и состояний среды с указанием соответствующих вероятностей и выигрышей для любых комбинаций альтернатив и состояний среды. СИСТЕМА ОБОЗНАЧЕНИЙ В разных литературных источниках используются различные обозначения для элементов дерева решений. Будем придерживаться следующей системы обозначений: – решение принимает первый (или единственный) осознанный игрок; – решение принимает второй осознанный игрок; – случайная ситуация; – результат для единственного игрока; – результат для первого и второго игрока соответственно. РАСЧЕТ ОТДЕЛЬНЫХ ЭЛЕМЕНТОВ ЭЛЕМЕНТ ПРИНЯТИЯ РЕШЕНИЯ ОСОЗНАННЫМ ИГРОКОМ В этом случае составляются и сравниваются суммы результатов самого решения и итоговых результатов и из них выбирается максимальная сумма: результат 1 + итог 1  результат 2 + итог 2   выбираем max сумму .  результат n + итог n  Максимальную сумму записывают в квадрат элемента решения и выделяют стрелку соответствующего решения (рис. 14). Рис. 14. Элемент принятия решения осознанным игроком 154 ПРИМЕР 1 Студент Вася Иванов рассматривает, что можно сделать с заработанными летом деньгами. Он может их сложить дома «под подушку» и не тратить. Он может положить в банк 50 000 руб. на год по 10% годовых. Еще он может вложиться в бизнес своего друга в сумме 40 000 и получить через год 60 000 руб. И последний вариант – он может взять кредит в банке в размере 30 000 руб. под 20% годовых, отдохнуть и отдать кредит через год. Записать схему ситуации и выбрать лучший для Васи вариант, если Вася хочет максимизировать дополнительный доход. Составим схему Васиной ситуации (рис. 15). Рис. 15. Схема ситуации Рассчитаем сумму для каждого варианта. Именно сумма отражает дополнительные доходы Васи. 00 0. Для первого варианта (первой стрелки): 50000  55000  5000 . Для второго варианта (второй стрелки): 40000  60000  20000 . Для третьего варианта (третьей стрелки): Для четвертого варианта (четвертой стрелки): 30000  36000  6000 . Максимальный вариант ( 20000 ) достигается в третьем случае (вклад в бизнес). Выделяем эту стрелку и результат записываем в квадрат (рис. 16). Рис. 16. Схема ситуации 155 ЭЛЕМЕНТ СЛУЧАЙНОГО ВЫБОРА Случайные ситуации будем рассматривать с позиций лучшего среднего. Это справедливо при многократной повторяемости результата. В этом случае для элемента находим средний результат (математическое ожидание), умножаем итоги на их вероятности и складываем: p1  итог 1+p2  итог 2+ pn  итог n . Этот результат записывают в круг случайного элемента (рис. 17). В этом случае никакие стрелки не выделяются! Рис. 17. Элемент случайного выбора ПРИМЕР 2 На самом деле друг Васи Иванова из задачи 1 не может гарантировать ему надежный доход с бизнеса, но обещает Васе такие результаты: с вероятностью 30% деятельность будет очень успешной, и он вернет Васе 120 000 руб.; с вероятностью 50% деятельность будет бесприбыльной, и Вася получит назад свои 40 000 руб.; в 20% случаев будут убытки, и Вася сможет получить назад только 20 000 руб. Записать схему ситуации и оценить средний результат деятельности бизнеса Васи. Составим схему ситуации (рис. 18). Рис. 18. Схема ситуации Средний результат Васи тогда будет равен: 156 0,3 120000  0,5  40000  0,2  20000  60000 . Записываем этот результат в круг (рис. 19), при этом никакие стрелки не выделяем. Рис. 19. Схема ситуации Правила построения и анализа дерева решений. Примеры принятия решений с использованием дерева решений Построение и анализ комбинированного дерева решений поясним на примере. Фирма в течение длительного времени занимается поставками дорогостоящих станков. Себестоимость одного станка 6500 тыс. руб. Клиенту станок продается за 8000 тыс. руб. Кроме поставки станка, фирма также производит его доработку (адаптацию) под клиента. Доработка обходится фирме в 40 тыс. руб. В процессе работы фирмы достаточно часто встречаются «привередливые» клиенты, которые требуют строгой процедуры приема-сдачи, в том числе по весьма несущественным признакам. Известно, что в 30% случаях выполнения заказа встречаются недостатки. Они не являются критическими и могут остаться не выявленными. Заранее определить наличие недостатков невозможно. Вероятность обнаружения недостатков при приемке составляет 60%. При выявлении недостатков клиент расторгает договор и ничего не платит. Если приемка проходит успешно, то «привередливые» клиенты требуют 50 тыс. руб. на мелкие доработки. Кроме описанной схемы работы с клиентами, можно действовать и по упрощенному способу поставок, когда фирма выступает в роли посредника, поставляющего станки. Станки продаются клиентам в данном случае по 7000 тыс. руб., никаких проверок и доработок не проводится. Также фирма рассматривает возможность привлечь для работы эксперта. Каждая экспертиза будет обходится фирме в 300 тыс. руб. Эксперт гораздо лучше разбирается в станках и в 80% случаях находит недостатки. Если недостатки найдены, то фирма может их устранить, что обходится ей дополнительно в 800 тыс. руб. 157 Каким образом в данной ситуации необходимо действовать фирме для получения максимальной выгоды, и какой в среднем доход с одного станка при этом будет получен? РЕШЕНИЕ У фирмы есть возможность действовать несколькими способами. Она может привлекать или не привлекать для работы специального эксперта. 1. Рассмотрим случай, когда фирма не привлекает эксперта. В процессе работы с клиентами фирма может придерживаться обычной или упрощенной схемы поставок. При упрощенной схеме работы фирма тратит 6500 тыс. руб. на поставку станка и получает от клиента 7000 тыс. руб., никаких проверок и доплат не производится. При обычной схеме поставок фирма тратит 6500 тыс. руб. на поставку станка и 40 тыс. руб. на его адаптацию (доработку). Клиент при этом требует проверки, в процессе которой могут обнаружиться или не обнаружиться недостатки. Если клиент обнаружил недостатки, то он расторгает договор с фирмой и ничего ей не платит. Если же не обнаружил, то он покупает у фирмы станок по цене 8000 тыс. руб. и просит 50 тыс. руб. на мелкие доработки. В результате фирма получит: 8000  50  7500 тыс. руб. Недостатки встречаются в 30% случаев выполнения заказа, а вероятность их обнаружения при приемке составляет 60%, отсюда, вероятность обнаружить имеющийся недостаток будет равна: 0,3  0,6  0,18 . Следовательно, вероятность не обнаружить недостатки при проверке составит: 1  0,18  0,82 . Составим дерево решений в данной ситуации (рис. 20). Рис. 20. Дерево решений 1 Поскольку фирма длительное время занимается данными поставками, то в вероятностной ситуации можно опираться на средний результат: 0  0,18  7950  0,82  6519 тыс. руб. 158 Таким образом, по упрощенной схеме в среднем выгода от продажи одного станка составит: 7000  6500  500 тыс. руб., а по обычной схеме: 6519  6540  21 тыс. руб. Видим, что применение обычной схемы в данном случае приводит к убыткам. А, значит, наиболее выгодный результат будет получен, если фирма будет действовать согласно упрощенной схеме. Тогда выигрыш составит 500 тыс. руб. Внесем результаты в соответствующие окошки Дерева решений 1 и выделим стрелку, приводящую к максимальному результату (рис. 21). Рис. 21. Дерево решений 1 ПРИМЕЧАНИЕ. При заполнении круглого окошка ни одна стрелка не выделяется, поскольку данная ситуация является вероятностной. 2. Рассмотрим случай, когда фирма нанимает эксперта. Каждая его экспертиза обходится фирме в 300 тыс. руб. В результате проведенной им экспертизы могут быть выявлены недостатки, либо будет получено заключение об их отсутствии. Допустим, эксперт не выявил недостатков. Как и в первом случае, фирма может придерживаться упрощенной, либо обычной схемы работы с клиентами. При использовании упрощенного способа фирма тратит 6500 тыс. руб. на поставку станка и получает от клиента 7000 тыс. руб., при этом никаких проверок и доплат не производится. При применении обычной схемы фирма тратит 6500 тыс. руб. на поставку станка и 40 тыс. руб. на его адаптацию (доработку), то есть в итоге тратится 6540 тыс. руб. «Привередливый» клиент при этом настаивает на проверке, в процессе которой могут обнаружиться или не обнаружиться недостатки. Если клиент выявит недостатки, то он расторгает договор с фирмой и ничего ей не платит. Если же не выявит, то покупает у фирмы станок по цене 8000 тыс. руб. и просит 50 тыс. руб. на мелкие доработки. В результате фирма получает: 8000  50  7500 тыс. руб. 159 Если экспертом выявлены недостатки, то у фирмы кроме упрощенной и обычной схем работы, появляется возможность применения обычного способа с устранением недостатков. В случае упрощенной схемы фирма тратит 6500 тыс. руб. на покупку станка и получает от клиента 7000 тыс. руб. При обычной схеме клиент в результате проверки может обнаружить или не обнаружить недостатки. Если обнаружил, то он расторгает договор и фирма ничего не получает, а если не обнаружил, то покупает у фирмы станок по цене 8000 тыс. руб., при этом фирма платит ему 50 тыс. руб. на мелкие доработки. В случае если фирма принимает решение устранить выявленные недостатки, ее затраты составят 6500 тыс. руб. на покупку станка, 40 тыс. руб. на адаптацию (доработку) станка и 800 тыс. руб. на устранение выявленных недостатков. При этом клиент покупает у фирмы станок за 8000 тыс. руб., а фирма платит ему 50 тыс. руб. на мелкие доработки (рис. 22). Рис. 22. Дерево решений 2 Поскольку известно, что в 30% случаев выполнения заказа встречаются недостатки, а эксперт находит эти недостатки в 80% случаях, то вероятность эксперта найти имеющиеся недостатки будет равна: 0,8  0,3  0,24 . Отсюда вероятность эксперта не найти недостатки составит: 1  0,24  0,76 . Рассмотрим ситуацию, когда эксперт обнаружил недостатки. При использовании обычной схемы, клиент настаивает на проведении строгой процедуры приема-сдачи, в результате которой могут быть выявлены или не выявлены недостатки. Поскольку в этом случае эксперт уже точно выявил, что недостатки есть, то вероятность их обнаружения по условию задачи составит 0,6. Соответственно, вероятность не обнаружения будет: 1  0,6  0,4 . Теперь рассмотрим случай, когда эксперт недостатков не выявил. Вычислим вероятности обнаружения и не обнаружения недостатков при применении обычной схемы. 160 Согласно условию задачи 30% станков имеют недостатки, соответственно, остальные 70% станков их не имеют. Из всех 30% станков с недостатками эксперт обнаружил имеющиеся недостатки в 24% случаях. А значит в 30%  24%  6% случаях имеющиеся недостатки им не были выявлены. Таким образом, свободными от недостатков были признаны 70%  6%  76% станков, причем 6% из них все же имеют недостатки. Следовательно, в случае если эксперт недостатков не обнаружил, доля бракованных станков равна  7 76  . Из этого количества в 60% случаях при процедуре приема-сдачи выявляются недостатки. Значит вероятность обнаружения недостатков в этом случае будет равна:  7 76   0,6  0,05 . Отсюда вероятность не обнаружения недостатков при обычной схеме составит: 1  0,05  0,95 (рис. 23). Рис. 23. Дерево решений 2 Заполним оставшиеся пустые окошки Дерева решений 2 (рис. 23). Начнем с случая, когда эксперт не обнаружил недостатков. Тогда при обычной схеме в среднем клиент заплатит: 0  0,05  7950  0,95  7552 тыс. руб. Следовательно, при применении обычной схемы получим: 7552  6540  1012 тыс. руб. При использовании упрощенной схемы выигрыш составит: 7000  6500  500 тыс. руб. Сравнивая полученные результаты видим, что более выгодным является применение обычной схемы. Внесем максимальный результат в соответствующее окошко Дерева решений 2 и выделим стрелку обычного способа. Аналогично рассмотрим случай, когда эксперт нашел недостатки. По упрощенной схеме получим: 7000  6500  500 тыс. руб. 161 По обычной схеме клиент в среднем заплатит: 0  0,6  7950  0,4  3180 тыс. руб. Следовательно, в этом случае средний выигрыш фирмы составит: 3180  6540  3360 тыс. руб. В случае устранения недостатков выгода от продажи одного станка составит: 7950  6540  800  610 тыс. руб. Наибольшим из трех результатов является 610 тыс. руб., полученный в случае устранения фирмой недостатков. Вписываем в соответствующее окошко число 610 и выделяем нижнюю стрелку («устранение»). Теперь можем заполнить первое круглое окошко Дерева решений 2. Если фирма наймет эксперта, то клиенты в среднем заплатят: 0,75  1012  0,24  610  915,5 тыс. руб. (рис. 24). Рис. 24. Дерево решений 2 3. Поскольку фирма в процессе своей работы может привлекать или не привлекать эксперта, то Дерево решений 1, соответствующее ситуации работы без эксперта, и Дерево решений 2, соответствующее случаю работы с привлечением эксперта, являются составными частями одного Общего дерева решений (рис. 25). В случае если фирма решает не привлекать эксперта, в среднем доход от продажи одного станка составит: 0  500  500 тыс. руб. Если же фирма решает привлечь эксперта, то с учетом стоимости экспертизы в 300 тыс. руб., этот доход равен: 915,5  300  615,5 тыс. руб. 162 Рис. 25. Общее дерево решений Из этих двух полученных ответов выбираем максимальное. Таким образом, в среднем доход фирмы от продажи одного станка составит 615,5 тыс. руб. (рис. 26). Рис. 26. Общее дерево решений Для получения такого результата фирме необходимо нанять эксперта. В случае если эксперт не найдет недостатков фирме выгоднее применять обычную схему работы. При этом в процессе проверки клиентом могут быть обнаружены недостатки и договор будет расторгнут, однако вероятность этого 163 очень мала ( р  0,05 ). В остальных случаях станок будет продан по 7950 тыс. руб., что существенно превышает стоимость продажи по упрощенной схеме (7000 тыс. руб.). Если эксперт выявит недостатки, то фирме будет выгодно из всех возможных схем придерживаться обычного способа с устранением недостатков. В этом случае имеющиеся недостатки могут быть обнаружены и устранены фирмой еще до продажи, соответственно, у клиентов не будет больших нареканий по качеству. ВЫВОД В среднем максимальный доход фирмы от продажи одного станка составит 615,5 тыс. руб. Для получения такого результата фирме необходимо нанять эксперта и в случае необнаружения им недостатков придерживаться обычной схемы работы, а случае обнаружения недостатков требуется выбрать обычный способ с устранением недостатков. ПРИМЕЧАНИЕ. Данный результат получен с ориентиром на «привередливых» клиентов, однако не все клиенты являются таковыми. Обычные клиенты не будут требовать проверки, а значит будут покупать станки по выгодной для фирмы цене 8000 тыс. руб. Следовательно, в общем случае средний доход фирмы от продажи одного станка будет еще выше. 164 ПРИМЕРЫ ПОЛУЧЕНИЯ ОПТИМАЛЬНЫХ РЕШЕНИЙ ДЛЯ НЕКОТОРЫХ ПРИКЛАДНЫХ ЗАДАЧ Основы теории массового обслуживания. Понятие системы массового обслуживания Во многих областях экономики, финансов, производства и быта важную роль играют системы специального вида, реализующие многократное выполнение однотипных задач. Подобные системы называются системами массового обслуживания (СМО). Примеры: покупатели возле касс магазина; очередь на остановке автобуса; автомобили у бензоколонки и т.д. Каждая СМО предназначена для обслуживания некоторого потока заявок, поступающих на вход системы в случайные моменты времени. Предметом изучения теории массового обслуживания является СМО. Цель теории массового обслуживания (ТМО) – выработка рекомендаций по рациональному построению СМО, организации их работы и регулированию потока заявок для обеспечения высокой эффективности функционирования СМО. Задача теории массового обслуживания: установление зависимостей эффективности функционирования СМО от ее организации. Классификация систем массового обслуживания и их основные характеристики СМО состоит из следующих элементов: входящего потока заявок, очереди на обслуживание, каналов обслуживания и выходящего потока заявок. Входящий поток   Очередь Каналы обслуживания  Выходящий поток    Возможны СМО, в которых отсутствует очередь. Такие системы называются системами с отказом. СМО с очередью делятся на 2 вида: 1. СМО с конечной длиной очереди (задана максимальная длина очереди); 2. СМО с ожиданием, где длина очереди не ограничена. Кроме того, существуют СМО, в которых ограничено время пребывания требования в очереди, после чего требование покидает СМО необслуженным. Входящий поток – совокупность заявок, которые поступают в СМО и нуждаются в обслуживании. Примеры: поток покупателей, приходящих в магазин; поток больных, поступающих в больницу, и т.д. По количеству каналов обслуживания: одноканальные СМО и многоканальные СМО. Примеры одноканальных СМО: парикмахерская с одним мастером; газетный киоск с одним продавцом. 165 Многоканальные СМО встречаются гораздо чаще. Они делятся на однородные, состоящие из одинаковых каналов обслуживания, и неоднородные, если каналы обслуживания различаются производительностью. Выходящий поток – поток требований, покидающих систему после обслуживания. Марковские случайные процессы Переход СМО из одного состояния в другое случайным образом называется случайным процессом. Пример: на бензоколонке время от времени возникают и исчезают очереди, появляется и исчезает бензин и т.д. Процесс, протекающий на бензоколонке, является случайным. Случайный процесс называется марковским процессом, если для любого момента времени t0 вероятностные характеристики процесса в момент t1 > t0 зависят только от его состояния в момент t0 и не зависят от того, как система пришла в это состояние в момент t0. Пример: на бензоколонке в момент t0 3 автомобиля в очереди и 1 заправляется; её состояние при t1 > t0 не зависит от того, какова история образования этого состояния, а зависит только от ее состояния в момент t0. Процесс называется процессом с дискретными состояниями, если его возможные состояния S0, S1, S2, ….. можно заранее перенумеровать и переход СМО из состояния в состояние происходит мгновенно. Процесс называется процессом с непрерывным временем, если моменты возможных переходов из состояния в состояние не фиксированы заранее и переход может осуществляться в любой момент. Пример: на бензоколонке с одним заправочным устройством одновременно могут находиться не более 3 автомобилей. Возможные состояния: S0 – ни одного автомобиля; S1 – 1 автомобиль заправляется, очередь пуста; S2 – 1 заправляется, 1 в очереди; S3 – 1 заправляется, 2-в очереди. Здесь переход из одного состояния в другое происходит практически мгновенно, в случайные моменты времени. Следовательно, это марковский процесс с дискретными состояниями и непрерывным временем. Графы состояний При анализе случайных процессов с дискретными состояниями широко используются графы состояний. Состояния изображаются прямоугольниками, а возможные переходы стрелками. Построим граф состояний для рассмотренного выше примера. S0 S3 Переход Si  S1  S2  Si+1 i  0,2 - прибытие очередного автомобиля. Переход Si  Si-1 ( i  1,3 ) – убытие заправленного автомобиля. При построении графа состояний СМО принимается, что вероятность строго одновременного появления двух или более заявок на входе системы или двух или более обслуженных заявок на выходе равна нулю. В данном случае переход из S0 в S2 или S3 невозможен. Потоки событий 166 Потоком событий называется последовательность однородных событий, следующих одно за другим в случайные моменты времени. Интенсивность потока событий  – среднее число событий, происходящих в единицу времени. Поток событий называется регулярным, если события следуют одно за другим через равные промежутки времени. Поток событий называется стационарным, если его вероятностные характеристики не зависят от времени. Здесь =const. Поток событий называется потоком без последействия, если для любых двух непересекающихся интервалов времени 1 и 2 число событий, попадающих на один из них, не зависит от того, сколько событий попало на другой. Поток событий называется ординарным, если совпадение в один и тот же момент времени двух и более событий невозможно. Поток событий называется простейшим, если он одновременно стационарен, ординарен и не имеет последействия. Если на графе состояний СМО у каждой стрелки проставить интенсивность потока событий, то такой граф называется размеченным графом состояний. Здесь ij – интенсивность потока событий, переводящего систему из состояния Si в состояние Sj 10 S0 21 S1 01 32 S2 12 S3 23 Законы распределения для важнейших потоков. Для простейшего потока событий интервал времени Т между двумя соседними событиями имеет показательное распределение с плотностью вероятности: (1) pt    et , t  0 В этом случае математическое ожидание равно среднеквадратичному отклонению: mT   T  1 (2)  Для работы СМО такой входной поток является наиболее тяжелым по сравнению с любым другим видом входного потока с той же интенсивностью . У любого другого потока событий mT = Т. Простейший поток увеличивает долю времени простаивания каналов обслуживания, а если СМО имеет ограниченную длину очереди, то увеличивает долю требований, получающих отказ в обслуживании. Найдем вероятность того, что интервал времени между двумя соседними событиями лежит в пределах от 0 до t t P t   e  t dt   e  t d  t   e  t | 0 t  1  e  t t Разложим экспоненту в ряд по степеням t: e   t 2 3   t   t   1   t    2! 3! Отсюда следует, что для малых t: P t  1  e t  1  1  t  t (3) 167 В теории вероятностей доказывается, что для простейшего потока интенсивностью  вероятность попадания на произвольный участок времени t равно k событий задается формулой Пуассона:  t k t P t   e k (4) k! Для пуассоновского потока математическое ожидание числа событий, наступивших за промежуток времени t, совпадает со среднеквадратичным отклонением и равно: mk   k  t (5) Уравнения Колмогорова в системах массового обслуживания. Уравнения Колмогорова для вероятностей состояния При анализе СМО принято считать, что все переходы СМО из состояния в состояние происходят под действием простейших потоков. В этом случае процесс в СМО будет марковским. Построим размеченный граф состояний для бензоколонки (из ранее рассмотренного примера): 10 S0 21 S1 01 32 S2 12 S3 23 На основе этого графа построим математическую модель процесса. Пусть Рi (i= 0,3 ) – вероятность того, что в момент t СМО находится в состоянии Si. Для любого момента времени можно записать: 3  P t   1 i 0 (1) i t – малое приращение t. Найдем P1(t+t) – вероятность того, что в момент (t+t) СМО будет находиться в состоянии S1. СМО может находиться в состоянии S1 в трех случаях: 1) В момент t СМО уже была в состоянии S1 и за время t не вышла из него; 2) В момент t СМО была в состоянии S0 и за время t перешла в состояние S1; 3) В момент t СМО была в состоянии S2 и за время t перешла в состояние S1. Найдем вероятность 1-го случая. Вероятность того, что СМО в момент t была в состоянии S1, равна p1(t). Эту вероятность надо умножить на вероятность того, что, находясь в S1, СМО не перейдет ни в S0 , ни в S2. Суммарный поток событий, выводящий систему из S1, будет простейшим с интенсивностью (10+12), т.к. суперпозиция простейших потоков также является простейшим потоком. Тогда вероятность выхода из S1 для малых t, как было показано выше, равна (10+12) t. Значит, вероятность невыхода из S1 равна 1-(10+12) t. Тогда вероятность того, что СМО останется в S1 в момент (t+t), равна: p1 t 1  10  12 t  (2) Найдем вероятность 2-го случая. Рассуждая аналогично, получим: p0 t 10t Для вероятности 3-го вида: p2 t 21t 168 Сложим вероятности этих трех случаев, получим: p1 t  t   p1 t   1  10  12   t   p 0 t   01  t  p 2 t   21  t p1  t  t   p1 t    p1 t   10  12   p 0 t 01  p 2 t  21 t При  t 0 получим, отбрасывая аргумент t: dp1   21 p 2  01 p 0  10  12   p1 dt (3)  dp0  dt  dp  1  dt  dp  2  dt  dp3   dt (4) Рассуждая аналогично для состояний S0, S2, S3, получаем систему дифференциальных уравнений, которые называются уравнениями А.Н. Колмогорова:  10 p1  01 p0  21 p2  01 p0  10  12  p1  12 p1  32 p3  21  23  p2  23 p2  32 p3 Общее правило составления уравнений Колмогорова: - в левой части i-го уравнения стоит производная вероятности i-го состояния; - в правой части каждого i-го уравнения стоит сумма произведений вероятностей всех состояний, из которых возможен непосредственный переход в i-ое состояние, на интенсивности соответствующих потоков, минус суммарная интенсивность всех потоков, выводящих сумму из i-го состояния, умноженная на вероятность данного состояния. Теорема. Если число состояний системы конечно, и из каждого из них можно за конечное число шагов перейти в любое другое состояние, то существует: i  I0 , pi  lim pi t  , (5) где I0 – множество всех состояний СМО, рi обычно толкуется, как доля времени пребывания СМО в i-ом состоянии при установившемся (т.е. стационарном) режиме функционирования СМО. рi называются финальными вероятностями состояний (ФВС). Для определения ФВС необходимо положить в уравнение Колмогорова все левые части равными нулю и решить полученную систему линейных алгебраических уравнений относительно рi, дополнив ее уравнением:  pi  1 iI 0 Любое из уравнений Колмогорова можно отбросить, т.к. оно является линейной комбинацией остальных. Для рассмотренного случая: 10 p1 0  01 p0    p      p   p 0  01 0 10 12 1 21 2  23 p2  32 p3  0   p0  p1  p2  p3  1 (Отброшено третье уравнение). Для решения этой системы необходимо знать ij ( i  0,3, j  0,3 ). 169 Схема гибели и размножения. Формула Литтла Размеченный граф состояний для схемы гибели и размножения имеет следующий вид: S0 01 S1 10 12 21 S2 23 32 k-1,k k,k-1 k,k+1 Sk k+1,k n-2,n-1 n-1,n-2 n-1,n Sn-1 n,n-1 Sn Sk соответствует численности популяции, равной k, переход Sk  Sk+1 происходит при рождении одного члена популяции, а Sk  Sk-1 – при гибели одного члена популяции. Из состояния Sk переход возможен только в Sk+1 или в Sk-1. Найдем для этой схемы ФВС. Используем правило. Считаем, что все потоки событий простейшие, и процесс в системе – простейший. Для состояния S0 имеем: 01 p0  10 p1 , (1) для состояния S1 имеем с учетом (1): 10  12  p1  01 p0  21 p2 , откуда аналогично: 12 p1  21 p2      k 1, k pk 1  k , k 1 pk      n 1, n pn 1  n , n 1 pn (2) Решим эту систему. Выразим р1 через р0: p1  01 p0 10 Далее: p2  p3  (3) 12   p1  12 01 p0 21 21 10 23    p2  23 12 01 p0 32 322110 и т.д. Все вероятности выражены через р0. Подставим в нормировочное условие:    1201     1 p0  p1    pn  p0 1  01  01 12    n 1, n   1021 n, n 1 2110  10  откуда:   1201      p0  1  01  12 01    n 1, n          10 21 10 n , n 1 21 10   1 (4) Формула Литтла При установившемся режиме работы СМО среднее число требований, прибывающих в СМО, равно среднему числу требований, покидающих СМО, и поэтому оба потока 170 имеют одну и ту же интенсивность эфф. Формула Литтла определяет среднее время пребывания требования в СМО (Wс) как функцию от среднего числа требований, находящихся в СМО (Lс): L Wc  c (5) эфф Аналогично определяется и среднее время пребывания требования в очереди W0 в зависимости от среднего размера очереди L0: W0  L0  эфф (6) Системы массового обслуживания с отказами и ожиданием 1. Задача Эрланга (n-канальная СМО с отказами). Имеется n каналов обслуживания, на которые поступает поток заявок с интенсивностью . Поток обслуживания имеет интенсивность   1 / t об. . Оба потока простейшие. Заявка не обслуживается, если в момент ее прихода все каналы заняты обслуживанием. Найти ФВС СМО и характеристики ее эффективности: λэфф. – среднее число заявок, обслуживаемых СМО в единицу времени. Q – средняя доля обслуженных заявок; Ротк – вероятность отказа. Граф состояний СМО соответствует схеме гибели и размножения:  S0   S1 μ S0 – все каналы свободны; nμ  S2 2μ   Sk 3μ kμ Sn (k+1)μ S1 – 1 канал занят, остальные свободны; и т.д. Переход СМО из Si в Si+1 (i= 0, n  1 ) происходит под действием входящего потока заявок, поэтому у верхних стрелок проставим λ. Если СМО находится в S1, то переход в S0 происходит с интенсивностью   1 / t обc. . Если работают 2 канала, то переход в S1 происходит, если закончил обслуживание либо 1й канал, либо 2-й. Общая интенсивность их потоков обслуживания 2μ. Аналогично суммарный поток обслуживания, даваемый k каналами, равен kμ. Используем формулы схемы гибели и размножения: 1   2 3 k n    p0  1   2    3 k n   2  2 * 3  k !  n !    2 k    n p1  p0 ; p2  p ;  ; p  p ;  ; p  p0 k n  2 2 k! k n! n  Обозначим p  – интенсивность нагрузки, получим формулы Эрланга:   2 3 k n   p0  1       2! 3! k! n!   1 171 (1) p1  p0 ; p2  2 2! k p0 ;  ; pk  k! p0 ;  ; pn  n n! (2) p0 Вероятность отказа Ротк равна вероятности того, что все каналы заняты: Pотк. n  pn  P0 n! Относительная пропускная способность Q: Q  1  Pотк.  1  n P0 n! Абсолютная пропускная способность λэфф.  n   Q   1  P0  n!   эфф. Среднее число занятых каналов k : λэфф. известно, это интенсивность потока обслуженных системой заявок. Каждый занятый канал в единицу времени обслуживает в среднем μ заявок. Следовательно, среднее число занятых каналов:  эфф.  т  k    1  P0   n!   2. n-канальная СМО с неограниченной очередью. Граф состояний СМО имеет вид:   S0  S1 μ  Sk 2μ kμ (k+1)μ   Sn nμ   Sn+1 nμ  Sn+r nμ nμ nμ Граф состояний соответствует схеме гибели и размножения, но с бесконечным числом состояний. Нумерация состояний – по числу заявок, находящихся в системе. Условие существования конечных вероятностей – ρ/n<1. При ρ≥n СМО не справляется с нагрузкой, и очередь растет неограниченно с течением времени. Применяя соответствующие формулы для схемы гибели и размножения, получаем: 1   2 n  n 1   ; p0  1       1 ! 2 ! n ! n ! n     для   n (3) - вероятность того, что все каналы свободны. Вероятность того, что все каналы заняты: pn  n n!  p0 (4) 172 Вероятность отказа Ротк. = 0, т.к. любое требование обслуживается. Относительная пропускная способность Q: Q  1  Pотк.  1 Абсолютная пропускная способность: эфф.    Q   Среднее число занятых каналов: k эфф.      Средняя длина очереди: L0    k  n  p k  n 1 k   n 1 p0   n  n!1   n  2    pn   n1   n  2  n    pn n   2 Среднее число заявок в системе: Lc  L0  k Применяя формулу Литтла, получаем среднее время пребывания заявки в СМО: Wc  Lc L  c эфф.  и в очереди: L L Wc  0  0 эфф.  3. n-канальная СМО с ограниченной длиной очереди. Если все каналы заняты, заявка становится в очередь только в том случае, если в ней находится менее m заявок. В противном случае поступающая заявка покидает СМО необслуженной. Граф состояний СМО имеет вид:  S0   S1 μ  Sk 2μ kμ (k+1)μ   Sn nμ   Sn+1 nμ Sn+m nμ nμ Это соответствует схеме гибели и размножения. Применяем соответствующие формулы, получаем: Вероятность того, что все каналы свободны: 1 m  n k  n 1      p 0    1    ;  k 0 k! n!n      n   1  n k m  p0    m ;  k  0 k! n!  для   n 173 для   n Вероятность отказа:  nm Pотк.  Pn  m  n!n m p0 Относительная пропускная способность: Q  1  Pотк. Абсолютная пропускная способность: эфф.  Q Среднее число занятых каналов обслуживания: k эфф.  Q  Средняя длина очереди: m        1   m  m  1    n    n 1   n L0  p0 ; 2 n!n   1   n  L0   n mm  1 n!  2  p0 ; для   n  для   n Среднее число заявок, находящихся в СМО: Lc  L0  k Среднее время пребывания заявки в СМО: Lc Wc  эфф. и в очереди – W0  L0 эфф. Принятие управленческих решений по результатам моделирования систем массового обслуживания Пример 1. В мужском зале парикмахерской 2 мастера стригут мужчин, а 2 мастера – детей. Заказы от детей и взрослых поступают с одинаковой интенсивностью 5 зак/час. Среднее время стрижки одинаково – 20 мин. Руководство решило объединить мастеров в одну группу, где стригут и детей, и взрослых. При этом детские мастера стали стричь взрослых за 22 мин., а взрослые мастера – детей также за 22 мин. Увеличилось ли время ожидания клиента в очереди при объединении двух групп в одну? Решение. Парикмахерская является СМО с неограниченной длиной очереди. Определим среднее время ожидания клиента в очереди для специализированных групп парикмахеров. Условия работы обеих групп одинаковы: 1 n=2, λ=5 зак/час, tобс.=20 мин/зак = ч/зак. 3 Среднее время ожидания клиентов в обеих группах будет одинаковым. 174 Интенсивность нагрузки:    1 2  tобс.  5  1 ;   n  3 3  2  1  2  . Следова 3  тельно, у СМО существует установившийся режим работы. Средняя доля времени простоя парикмахеров из-за отсутствия клиентов: 1 1 3 2 3   2 k   2   2  2  1 1   1  1    2 1    n k  n 1  2  3 3 3  3     p0      11       0,0909    1   2  k! 3 2!  k 0  k  0 k! n!n    2!  2! 2  1     3  3     Примерно 9% своего рабочего времени парикмахеры простаивают. Среднее число клиентов в очереди: 3  2 1   n 1 1  3 n0   p0   0,09(09)  3,79 2 2 n!n      1  1   n   2!21  3  2       Среднее время пребывания клиента в очереди: n 3,79 t0  0   0,758 час  5 Теперь рассмотрим работу объединенной группы. Интенсивность входного потока здесь равна сумме интенсивностей потоков детей и мужчин: λ= 5+5 =10 n=4 – общее число каналов обслуживания. Поскольку входные потоки детей и мужчин одинаковы, среднее время обслуживания может определяться следующим образом: 20  22 мин 7 час tобс.   21  2 зак 20 зак Интенсивность нагрузки:  7      tобсл.  10  3,5 ;  20 Следовательно:   n 3,5  4 У СМО существует установившийся режим работы. Средняя доля времени простоя парикмахеров:  n k  n 1  p0      k  0 k! n!n  p  1  4 k  5      k  0 k! 4!4  3,5 1 1   3,52 3,53 3,54 3,55     1  3,5    0,0145 2 6 24 24  0,5   В объединенной группе время простоя стало значительно меньше, чем в специализированной группе. Почему? Средняя длина очереди:  n 1 3,55 n0   p   0,0145  5,09 2 2    3,5  n!n1   4!4  1   n 4    175 В предыдущем случае было две очереди по 3,79 человека, а общее число ожидающих было в среднем 3,79  2  7,6 . Теперь ожидающих стало меньше. Среднее время пребывания в очереди: n0 5,09 tоч.    0,509 час.  10 Это время сократилось. Было 0,758 час. Пример 2. Комбинат общественного питания получает овощи из теплиц пригородного совхоза. Автомобили с грузом прибывают в случайные моменты времени с интенсивностью λ=6 машин в день. Подобные помещения и прочее позволяют обрабатывать и хранить товар в объеме m=2 автомобилей. На комбинате работают n=3 повара, каждый может обрабатывать товар с 1 машины за tобс.= 4 часа. Рабочий день повара при сменной работе 12 часов. Какова должна быть емкость складского помещения, чтобы вероятность обработки товаров была больше или равна Робс. = 0,97. Решение. Последовательно определяем показатели состояния комбината как СМО для различных значений емкости склада m= 2,3,4 и т.д., и на каждом этапе сравниваем вероятности обслуживания с заданной величиной. Интенсивность нагрузки поваров:  6   2  12 / 4 Вероятность простоя поваров для m=2: 1 1 m 2  n k  21 2 2 23  n 1      23 1   2   p0    1      1     1      0,128 1! 2! 3! 3!3  2   3   k  0 k! n!n      n    Доля машин, получивших отказ в обслуживании:  n  m 23 2 pотк.    0,128  0,076 n!n m 3!32 Вероятность обслуживания: pобс.  1  pотк.  0,924 Полученная величина меньше требуемой 0,97, поэтому продолжим вычисления для m=3. Получим: pо = 0,122; pотк. = 0,048; pобс. = 1- pотк. = 0,952. Вероятность обслуживания и в этом случае меньше заданной величины, поэтому примем m=4, для этого состояния получим следующие значения: pо = 0,12; pотк. = 0,028; pобс. = 0,972  0,97. Теперь полученная величина вероятности обслуживания удовлетворяет условию задачи, следовательно, емкость склада необходимо увеличить до m=4 автомобиля. Для достижения заданной вероятности обслуживания можно подобрать таким же образом количество поваров, проводя последовательно вычисления показателей для n=3,4,5 и т.д. Оптимальный вариант решения можно найти путем сравнения дополнительных затрат при различных вариантах реорганизации работы комбината для достижения pобс.=0,97. Управление распределением ресурсов в организационных системах Достаточно широко встречаются случаи, когда необходимо распределить ресурсы между подразделениями организационной системы. При этом целью 176 распределения является не оптимизация какого-либо параметра, а создание некоторого постоянно и быстро работающего механизма распределения с гарантией «справедливости» распределения и лучшего соответствия общим целям организации. Модель распределения ресурсов В рамках данной задачи будем моделировать организационную систему следующим образом: Центр (есть запас ресурса R) Подразделение 1 (потребность s1) Подразделение 2 (потребность s2) ... Подразделение n (потребность sn) Центр (Ц) должен распределить между подразделениями ( 1,  2 , ,  n ) однородный ресурс. Запас ресурса у Центра равен R . Каждое из подразделений  i нуждается в ресурсе в количестве si . Подразделения сообщают Центру свои потребности в ресурсе в виде заказов xi (которые могут отличаться от реальных потребностей si ). Обладая информацией о заказах, Центр выдает подразделениям ресурс в количествах yi . Цель данного раздела – рекомендовать методики определения yi при известной информации о R и xi . Необходимые пояснения: 1) почему запрос может отличаться от потребности? Пример: если у центра всегда дефицит ресурса и центр всегда выдает половину от запроса, то, очевидно, подразделения будут стараться просить в два раза больше имеющихся потребностей; 2) почему выдача может отличаться от запроса? Несмотря на то, что центр заинтересован в удовлетворении потребности подразделений, ему может просто не хватать ресурсов. Важные замечания: 1) ресурс необходим для осуществления общей деятельности организации и Центр старается максимально удовлетворить потребности подразделений; 177 2) подразделению желательно получить ресурс именно в необходимом количестве, получение ресурса в меньших или превышающих количествах не выгодно; 3) у каждого подразделения есть своя задача, для которой нужен ресурс, и руководитель его заинтересован в выполнении именно этой задачи; 4) центр заинтересован в совокупном результате работы подразделений; 5) так как ресурс не выгодно получать больше, то Центр никогда не выдаст подразделению больше запроса, то есть всегда yi  xi . Случай достаточности ресурсов Рассмотрим случай, когда у центра хватает ресурсов, чтобы удовлетворить все заявки подразделений: R  x1  x2   xn . Из сказанного выше о заинтересованности Центра в полноценной работе всех подразделений следует, что в этом случае Центр выделит каждому подразделению столько ресурсов, сколько подано в заявке. Таким образом, решение в случае достаточности ресурсов тривиально: y1  x1 y2  x2 yn  xn . Случай дефицита ресурсов Все дальнейшие методы будут относиться только к случаю дефицита ресурса: R  x1  x2   xn . Простейшие методики распределения ресурсов в организационных системах, их достоинства и недостатки. Манипулирование при распределении Метод прямых приоритетов В этом методе Центр устанавливает для всех подразделений приоритеты Ai , тем большие, чем важнее деятельность именно данного подразделения. После чего, ресурс распределяется по следующей формуле: yi  min  xi ;   Ai  xi  , где общий для всех подразделений параметр  определяется из условия необходимости распределения всего ресурса: y1  y2   yn  R . Для определения параметра  можно использовать, например, инструмент Поиск решения в MS Excel. В частном случае равенства приоритетов всех подразделений получим: R , yi    xi ,  x1  x2   xn 178 то есть все подразделения получат долю от запроса равную доле суммарного ресурса от суммарного запроса. Метод получил свое название в связи с прямой пропорциональностью выдачи и запроса. Достоинства метода прямых приоритетов 1. Метод позволяет расставить приоритеты подразделениям. 2. Все подразделения получат хоть какое-то количество ресурса. 3. Чем больше нужно ресурса для деятельности, тем больше будет выдано. Недостатки метода прямых приоритетов 1. Метод нельзя использовать в случае, если нужно удовлетворить потребности по принципу «все или ничего». 2. Метод существенно манипулируем и стимулирует завышение запросов; как следствие, центр получает искаженную «завышенную» информацию о потребностях. Место метода прямых приоритетов Метод прямых приоритетов хорошо соответствует ситуации распределения ресурсов, необходимых для основной деятельности, но которых допустимо получить меньше, чем требуется (упаковка товаров, канцтовары для текущей деятельности и др.). Понятие манипулирования В рамках данной темы будем использовать следующее определение манипулирования. Манипулирование – это улучшение своей ситуации за счет искажения собственной заявки при обладании информацией об общем количестве ресурса и заявках всех остальных подразделений. Действительно, в методе прямых приоритетов очень легко манипулировать следующим образом. Если руководитель одного из подразделений получает информацию, что ресурса недостаточно и его подразделение получит меньше требуемого количества, то он может соответствующим образом увеличить свою заявку и, как и подразумевается методом, получить большее количество ресурсов. Пример. Два подразделения с одинаковым приоритетом имеют потребность в ресурсе s1  40 и s2  60 единиц соответственно. Ресурса имеется R  70 единиц. Тогда, если подразделения сделают заявки по потребностям x1  40 и x2  60 , то по методу прямых приоритетов для равных приоритетов каждое из них получит 0,7 от запроса, так как: 179  70  0,7 . 40  60 Тогда: y1  0,7  40  28 , y2  0,7  60  42 . Представим, что руководитель первого подразделения узнал всю информацию о количестве ресурса и запросе своего «коллеги» из второго подразделения. Тогда он может изменить свой запрос и попросить x1  80 единиц. В этом случае получим: 70   0,5 . 80  60 y1  0,5  80  40 , y2  0,5  60  30 . Таким образом, руководителю первого подразделения удалось за счет искажения информации в запросе получить ровно столько, сколько ему требовалось. В результате, при информации о дефиците все подразделения, будут стараться попросить больше, чем им требуется. Центр будет обладать информацией о завышенных потребностях, а после приобретения соответствующего количества ресурса он может стать невостребованным. Метод обратных приоритетов В этом методе Центр так же устанавливает для всех подразделений приоритеты Ai , тем большие, чем важнее деятельность именно данного подразделения. После чего, ресурс распределяется по следующей формуле:  1 yi  min  xi ;   Ai   , xi   где общий для всех подразделений параметр  определяется из условия необходимости распределения всего ресурса: y1  y2   yn  R . Для определения параметра  можно использовать, например, инструмент Поиск решения в MS Excel. Метод получил свое название в связи с обратной пропорциональностью выдачи и запроса. Достоинства метода обратных приоритетов 1. Метод позволяет расставить приоритеты подразделениям. 2. Все подразделения получат хоть какое-то количество ресурса. 3. Метод стимулирует «скромность», снижение запросов. 4. Метод слабо манипулируем. Недостатки метода обратных приоритетов 1. Метод нельзя использовать в случае, если нужно удовлетворить потребности по принципу «все или ничего». 180 2. Метод приводит к занижению запросов; как следствие, центр получает искаженную «заниженную» информацию о потребностях, а такая информация приводит к устойчивому дефициту. Пояснение. В случае прямых приоритетов искажение информации приводило к необходимости наращивать закупку ресурса, но после его достаточного приобретения у центра появлялась возможность выявить достоверные потребности (так как при достаточности нет смысла изменять запрос). В этом же случае подразделения будут просить меньшие количества и Центр не будет иметь стимула повышения количества ресурсов и не получит объективную информацию. Место метода обратных приоритетов Метод обратных приоритетов хорошо соответствует ситуации распределения не основных ресурсов, обеспечивающих побочные процессы деятельности (организация PR акций, оформление территорий и др.). Метод открытого управления В этом методе ресурс распределяется по следующей формуле: yi  min  xi ;   , где общий для всех подразделений параметр  определяется из условия необходимости распределения всего ресурса: y1  y2   yn  R . Для определения параметра  можно использовать, например, инструмент Поиск решения в MS Excel. Иными словами, все, кому нужно мало ресурса, получат его в нужном количестве, а те, кому не хватит – получат ресурс поровну. Метод получил свое название в связи с невозможностью манипулирования и, как следствие, допустимостью полной открытости информации. Достоинства метода открытого управления 1. Все подразделения получат хоть какое-то количество ресурса. 2. Можно собирать информацию открыто. 3. Центр будет обладать объективной информацией о запросах. Недостатки метода открытого управления 1. Метод нельзя использовать в случае, если нужно удовлетворить потребности по принципу «все или ничего». 2. Нет возможности расставить приоритеты. Но для этого может быть использован метод открытого управления с приоритетами (см. ниже). Место метода открытого управления Метод открытого управления хорошо соответствует ситуации распределения не основных ресурсов. 181 Метод открытого управления с приоритетами В этом методе Центр так же устанавливает для всех подразделений приоритеты Ai , тем большие, чем важнее деятельность именно данного подразделения. После чего, ресурс распределяется по следующей формуле: yi  min  xi ;   Ai  , где общий для всех подразделений параметр  определяется из условия необходимости распределения всего ресурса: y1  y2   yn  R . Для определения параметра  можно использовать, например, инструмент Поиск решения в MS Excel. Этот метод является развитием метода открытого управления с целью учета приоритетов подразделений. Метод конкурсного распределения ресурсов В этом методе Центр определяет для себя эффект от деятельности каждого подразделения ei и определяется эффективность всех подразделений по формулам: e wi  i xi После этого ресурс распределяется подразделениям полностью в порядке убывания эффективности пока хватает ресурса. И для этого случая удобно использовать MS Excel с целью быстрых расчетов эффективности, упорядочивания подразделений по этому признаку и контролю распределения ресурса. Достоинства метода конкурсного распределения 1. Метод нельзя использовать в случае, если нужно удовлетворить потребности по принципу «все или ничего». 2. Нет возможности манипулировать. Недостатки метода конкурсного распределения 1. Будут полностью неудовлетворенные подразделения. 2. Нет возможности расставить приоритеты. Место метода конкурсного распределения Метод конкурсного распределения используется в случае, когда нужно распределить ресурс по принципу «все или ничего». 182

«Методы оптимальных решений» 👇

Готовые курсовые работы и рефераты

Купить от 250 ₽

Решение задач от ИИ за 2 минуты

Решить задачу

Помощь с рефератом от нейросети

Написать ИИ

Смотреть все 938 лекций

Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot

Методы оптимальных решений

Тебе могут подойти лекции

Другие технические предметы

Помощь с написанием учебных работ