Информационные системы

⌛ 2014 год
👀 1242 просмотра
📌 1181 загрузка

Выбери формат для чтения

Конспект лекции по дисциплине «Информационные системы», docx

Загружаем конспект в формате docx

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Информационные системы», Word формат

ИНФОРМАЦИОННЫЕ СИСТЕМЫ Материал для самостоятельной подготовки студентов специальностей «Документоведение» и «Документационное обеспечение управления» Челябинск, 2014 Цель дисциплины: научить студентов применять современные программные продукты, информационные системы и технологии в своей профессиональной деятельности.. Основные задачи дисциплины: • сформировать у студентов представление о содержании информации, информационных систем и технологий, особенностях обработки информации; • обучить технологиям и методам обработки информации, принципам функционирования и проектирования документальных информационных систем; • познакомить студентов с организационно-методическими основами функционирования корпоративных информационных систем. Теоретическая база дисциплины предусматривает наличие базовой подготовки по информатике. Необходимое техническое и программное обеспечение для освоения материала: 1. ПК с возможностью выхода в глобальную сеть Internet 2. установленный на ПК программный пакет MS Office 2007 и выше, включающий MS Access 3. установленное на ПК приложение для чтения текстовых документов формата *.pdf, например, Adobe Reader (данная программа является бесплатной, скачать программу можно с официального сайта разработчика: http://www.adobe.com/ru/downloads/). Тематическое содержание дисциплины 1. Информационные системы – основной инструмент информатизации 2. Классификация информационных систем 3. Автоматизированные информационные технологии 4. Документальные информационные системы и информационно-поисковые языки. Лингвистические основы информатики. 5. Гипертекстовые технологии поиска. Системы управления базами данных (СУБД). Банки данных. Самостоятельное задание (итоговое) В качестве самостоятельной (итоговой) работы, необходимо выполнить реферат на тему: «Информационные системы в ДОУ» и отправить на электронную почту преподавателя в формате *.doc (Microsoft Word) согласно графику сдачи заданий. 1. Информационные системы – основной инструмент информатизации Задача накопления, обработки и распространения (обмена) информации стояла перед человечеством на всех этапах его развития. В течение долгого времени основными инструментами для ее решения были мозг, язык и слух человека. Первое кардинальное изменение произошло с приходом письменности, а затем изобретением книгопечатания. Поскольку в эпоху книгопечатания основным носителем информации стала бумага, то технологию накопления и распространения информации естественно стали называть “бумажной информатикой”. Положение в корне изменилось с появлением электронных вычислительных машин (ЭВМ). Первые ЭВМ использовались как большие автоматические арифмометры. Принципиально новый шаг был совершен, когда от применения ЭВМ для решения отдельных задач перешли к их использованию для комплексной автоматизации тех или иных законченных участков деятельности человека по переработке информации. Данные процессы связаны с термином компьютеризации и информатизации общества. Наиболее полным представляется взгляд на информатизацию А. Урсула, согласно которому информатизация есть системно-деятельностный процесс овладения информацией как ресурсом управления и развития с помощью средств информатики и с целью создания информационного общества. Под информатизацией в широком смысле слова понимается процесс изменения жизнедеятельности всего общества, всех его систем и структур за счет резкого повышения эффективности производства, хранения и распространения всех видов информации и знаний, которые уже включены и еще будут включаться в общественное производство жизни людей. Информатизация есть создание оптимальных условий для удовлетворения информационных потребностей и реализации прав граждан, органов власти, общественных организаций на основе формирования и использования информационных ресурсов. Информатизация не тождественна компьютеризации общества, но эти процессы сопряжены. Информатизация общества более широкое понятие, связанное с обеспечением всех заинтересованных субъектов достоверной, своевременной и исчерпывающей информацией во всех сферах человеческой деятельности. Информатизация включает в себя три взаимосвязанных компонента: медиатизацию - процесс совершенствования средств сбора, хранения и распространения информации; компьютеризацию - процесс совершенствования средств поиска и обработки информации; интеллектуализацию - процесс развития способности восприятия и порождения информации, то есть повышение интеллектуального потенциала общества, включая использование средств искусственного интеллекта. Появление и развитие компьютеров – это необходимая составляющая процесса информатизации общества. Информатизация общества является одной из закономерностей современного социального прогресса. При информатизации общества основное внимание уделяется комплексу мер, направленных на обеспечение полного использования достоверного, исчерпывающего и своевременного знания во всех видах человеческой деятельности. Информатизация общества — организованный социально - экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей и реализации прав граждан, органов государственной власти, органов местного самоуправления, организаций, общественных объединений на основе формирования и использования информационных ресурсов Информационное общество – общество, в котором большинство работающих занято производством, хранением, переработкой и реализацией информации, особенно высшей ее формы – знаний. Цель информатизации - улучшение качества жизни людей за счет повышения производительности и облегчения условий их труда. Основными критериями развитости информационного общества являются следующие: • Наличие компьютеров; • Уровень развития компьютерных сетей • Владение информационной культурой, т.е. знаниями и умениями в области информационных технологий Виды информации Информация: • Первичная (необработанная или элементарная) • Обработанная Первичная информация – это выражение некоторого факта, поведения, то есть того, что характеризует определенное событие, ситуацию, состояние. Обработанная информация – это результат переработки первичной или ранее обработанной информации. Прежде чем использовать и переработать информацию ее необходимо собрать и сохранить. При этом очень важно, чтобы процедуры сбора и сохранения информации не изменяли свойств и качества информации. Важную роль играет и срок хранения информации, влияющий на ее ценность. Три критерия качества информации: 1. Актуальность. Этот критерий связан с понятием срока старения информации. 2. Полнота. Этот критерий связан с понятием объема и количества информации. 3. Точность. Управленческая информация Информацию, предназначенную для управления, можно условно разбить на три уровня: оперативная, тактическая и стратегическая. Оперативная информация нужна на нижнем уровне управления предприятием в повседневной работе. Она представляет собой часто обновляемую, первичную, рутинную информацию. Оперативная информация – основа в информационной иерархии ИС, поэтому ее обработка автоматизируется в первую очередь. Тактическая информация получается путем обобщения информации оперативного уровня и предназначена для руководителей среднего звена. Автоматизация существенно ускоряет подготовку тактической информации, которая выдается в виде отчетов, различных вариантов решения на основании информационного запроса. Стратегическая информация, предназначенная для руководства, получается в результате обработки оперативной и тактической информации. Она содержит краткие, но содержательные сводки, отчеты, прогнозы. На ее основе осуществляются долгосрочное планирование и разработка бизнес-плана предприятия в целом. Информация: синонимы «сообщение» и «данные». Данные – факты или идеи, выраженные в формализованном виде, обеспечивающем возможность их хранения, обработки и передачи. В результате обработки данные приобретают смысл, то есть становятся информацией. Сообщение включает в себя набор данных, объединенных общим контекстом или смыслом. Информация извлекается из сообщения и зависит от объекта воспринимающего (обрабатывающего) это сообщение. Результат зависит от свойств этого объекта. В зависимости от целей и интересов из одного и того же сообщения можно извлечь совершенно разную информацию. Информация может быть передана устно и письменно, с помощью электрических сигналов и электромагнитных волн и др. После обработки, преобразования, систематизации может быть получена новая информация, новые знания. Процессы преобразования информации связаны с информационными технологиями. Технология при переводе с греческого (techne) означает искусство, мастерство, умение, а это не что иное, как процессы. Под процессом следует понимать определенную совокупность действий, направленных нa достижение поставленной цели. Процесс должен определяться выбранной человеком стратегией и реализоваться с помощью совокупности различных средств и методов. Под технологией материального производства понимают совокупность средств и методов обработки, изготовления, изменения состояния, свойств, формы сырья или материала. Технология изменяет качество или первоначальное состояние материи в целях получения продукта. Информация является одним из ценнейших ресурсов общества, наряду с такими традиционными материальными видами ресурсов, как нефть, газ, полезные ископаемые и др., а значит, процесс ее переработки по аналогии с процессами переработки материальных ресурсов можно воспринимать как технологию. Информационные технологии Информационная технология (ИТ) - совокупность средств и методов сбора, обработки и передачи данных (первичной информации) для получения информации нового качества о состоянии объекта, процесса или явления (информационного продукта). Цель информационной технологии - производство информации для ее анализа человеком и принятия на его основе решения по выполнению какого-либо действия. Практическое приложение методов и средств обработки данных может быть различным, поэтому целесообразно выделить глобальные, базовые и конкретные информационные технологии. Глобальная информационная технология включает модели, методы и средства, формализующие и позволяющие использовать информационные ресурсы общества. Базовая информационная технология предназначена для определенной области применения (производство, научные исследования, обучение и т.д.). Конкретные информационные технологии реализуют обработку данных при решении функциональных задач пользователей (например, задачи учета, планирования, анализа). Как и все технологии, информационные технологии находятся в постоянном развитии и совершенствовании. Этому способствуют появлению новых технических средств, разработке новых концепции, методов организации данных, их передачи, хранения и обработки, форм взаимодействия пользователей с техническими и другими компонентами информационно-вычислительных систем. Расширение круга лиц, имеющих доступ к информационно-вычислительным ресурсам систем обработки данных, а также использование вычислительных сетей, объединяющих территориально удаленных друг от друга пользователей, особо остро ставят проблему обеспечения надежности данных и защиты их от несанкционированного доступа. В связи с этим современные информационные технологии базируются на концепции использования специальных аппаратных и программных средств, обеспечивающих защиту информации. Техническими средствами производства информации являются аппаратное, программное и математическое обеспечение процесса. Выделим отдельно из этих средств программные продукты и назовем их инструментарием, а для большей четкости можно его конкретизировать, назвав программным инструментарием информационной технологии. Инструментарий информационной технологии - один или несколько взаимосвязанных программных продуктов для определенного типа компьютера, технология работы в котором позволяет достичь поставленную пользователем цель. В качестве инструментария можно использовать следующие распространенные виды программных продуктов для персонального компьютера: текстовый процессор (редактор), настольные издательские системы, электронные таблицы, системы управления базами данных (СУБД), электронные календари, информационные системы функционального назначения (финансовые, бухгалтерские, для маркетинга и пр.), экспертные системы и т.д. Информационная технология тесно связана с информационными системами, которые являются для нее основной средой. На первый взгляд может показаться, что определения информационной технологии и системы очень похожи между собой. Информационная технология является процессом, состоящим из четко регламентированных правил выполнения операций, действий, этапов разной степени сложности над данными, хранящимися в компьютерах. Основная цель информационной технологии - в результате целенаправленных действий по переработке первичной информации получить необходимую для пользователя информацию. Информационный аспект – включает описание принципов и методов производства. Инструментальный – орудия труда, с помощью которых реализуется производство. Социальный – кадры и их организацию. Особенностью ИТ является то, что в ней и предметом и продуктом труда является информация, а орудиями труда – средства вычислительной техники и связи. Для того, чтобы в материальном мире происходили обмен информацией, ее преобразование и передача, должны быть использованы источник информации, передатчик, канал связи, приемник и получатель информации. Среда передачи объединяет источник и получателя информации в ИС. Информационная система Получатель информации оценивает ее в зависимости от того, для какой задачи она будет использована. Поэтому информация обладает свойством относительности. В зависимости от того, с каких позиций оценивается информация, различают такие ее аспекты, как синтаксический, семантический и прагматический. Синтаксический аспект связан со способом представления информации вне зависимости от ее смысловых и потребительских качеств. На синтаксическом уровне рассматриваются формы представления информации для ее передачи и хранения. Характеристики процессов преобразования сообщения для его передачи определяют синтаксический аспект информации при ее передаче. При хранении синтаксический аспект определяется другими формами представления информации, которые позволяют наилучшим образом осуществить поиск, запись, обновление, изменение информации в информационной базе. Информацию, рассмотренную только относительно синтаксического аспекта, часто называют данными. Семантический аспект отражает смысловое содержание информации и соотносит ее с ранее имевшейся информацией. Смысловые связи между словами или другими элементами языка отражает тезаурус. Тезаурус состоит из двух частей: списка слов и устойчивых словосочетаний, сгруппированных по смыслу, и некоторого ключа, например алфавитного, позволяющего расположить слова в определенном порядке. При получении информации тезаурус может изменяться, и степень этого изменения характеризует воспринятое количество информации. Прагматический аспект определяет возможность достижения поставленной цели с учетом полученной информации. Этот аспект отражает потребительские свойства информации. Если информация оказалась ценной, поведение ее потребителя меняется в нужном направлении. Проявляется прагматический аспект информации только при наличии единства информации (объекта), потребителя и поставленной цели. Информация проходит три этапа, которые и отражают все указанные аспекты. Сначала наблюдается некоторый факт окружающей действительности, который отражается в сознании в виде определенного набора данных. Затем, после определенной структуризации этих данных в соответствии с конкретной предметной областью, формируется знание о наблюдаемом факте, что отражает семантический аспект полученной информации. Информация в виде знаний имеет высокую степень структуризации, что позволяет выделять полную информацию об окружающей нас действительности и создавать информационные модели исследуемых объектов. 2. Классификация информационных систем По функциональному назначению информационные системы делятся на 3 основных типа: • фактографические; • документальные; • интеллектуальные. Фактографические информационные системы содержат формализованные данные об объектах фиксированной длины. Записи в этой информационной системе имеют фиксированный формат. Каждая запись в такой информационной системе имеет ключ (ключевое слово), которое однозначно идентифицирует каждую запись в файловой информационной системе. Центральное функциональное звено фактографических информационных систем – системы управления базами данных (СУБД). Они используются не только для реализации справочных функций, но и для решения задач обработки данных (ввод, хранение, сортировка, отбор, группировка записей и другие). Документальные информационные системы содержат неформализованные тексты документов. Они служат для работы с документами на естественном языке – монографиями, публикациями в периодике, сообщениями пресс-агенств, текстами законодательных актов. Они обеспечивают их смысловой анализ при неполном, приближенном представлении смысла. Основной задачей этих информационных систем является хранение и поиск документов по их содержанию. Интеллектуальные информационные системы содержат формализованные сведения из различных областей знания. Понятие базы знаний возникло в связи с появлением систем искусственного интеллекта. Базы знаний содержат факты и правила. Факты представляют собой изменяющуюся информацию, например, факты, характеризующие состояние объекта. Правила являются долговременной информацией о том, как порождать новые факты. Характерными примерами применения баз знаний являются обучающие системы, системы машинного перевода, экспертные системы в разных отраслях (в том числе экспертные системы экономического анализа деятельности предприятия, инвестиционного проектирования, систем управления бизнес процессами). По отношению к использованию технических средств (ЭВМ) информационные системы делятся на локальные и распределенные. Локальные информационные системы размещаются в памяти одной ЭВМ, распределенные – на нескольких, независимо от того, находятся ли они рядом или удалены друг от друга территориально. Концепция распределенных информационных систем возникла в 70-годах в связи с решением следующих проблем: • при создании информационных систем больших объемов приходится считаться с ограничениями со стороны ЭВМ относительно объемов внешней памяти и скорости обработки данных; • для описания некоторой предметной области необходимы данные; как правило, даже для описания одной предметной области данные территориально распределены, что создает большие трудности по сбору информации и централизованному сопровождению информационных систем; • часть информации, содержащаяся в информационной системе, не всегда активно используется всеми пользователями информационные системы, в результате чего возникает вопрос об эффективности использования информационные системы. В ходе решения этих проблем возникли локальные информационные системы, то есть информационные системы на ЭВМ пользователей. Тем самым информационные системы приближались к месту возникновения данных, либо к месту их наибольшего использования и одновременно с этим облегчалось сопровождение информационные системы. Однако решение вышеуказанных проблем породило другую проблему – обеспечение доступа к информации для всех ее пользователей и возможность ее получения для решения пользователями своих локальных задач. Локальные ЭВМ пользователей стали объединяться в сети ЭВМ. Совокупность локальных информационных систем, функционирующих на ЭВМ, входящих в сеть ЭВМ, представляет собой распределенную информационную систему. При этом предполагается, что каждая локальная информационная система имеет свою локальную систему управления. Распределенная информационная система функционирует под управлением распределенной системы управления, которая оснащается специальными каталогами, включающими сведения о структуре сети, о локальных системах управления и локальных информационных систем, а также специальным программным обеспечением. По отношению к моделям данных, которые поддерживает систему управления на логическом уровне, информационные системы делятся на сетевые, иерархические и реляционные. В сетевой модели данные представлены в виде произвольного графа. Для этой модели характерны все операции на множестве графов. В иерархической модели данные представлены в виде набора древовидных структур, а среди операций работы с иерархическими структурами есть операции перемещения по иерархическим путям вниз и вверх по деревьям. В реляционной модели данные представлены в виде таблиц (отношений). В последнее время к трем традиционным моделям данных добавилась объектно-ориентированная модель. По степени автоматизации информационных процессов в системе управления фирмой, ИС делятся на: • ручные, • автоматические, • автоматизированные. • В зависимости от характера обработки данных ИС делятся на информационно-поисковые и информационно-решающие. • Информационно-поисковые системы производят ввод, систематизацию, хранение, выдачу информации по запросу пользователя без сложных преобразований данных. • Информационно-решающие системы осуществляют, кроме того, операции переработки информации по определенному алгоритму. • По характеру использования выходной информации такие системы принято делить на управляющие и советующие принимаемые человеком решения. • Для управляющих систем характерны задачи расчетного характера и обработка больших объемов данных. • Советующие системы имитируют интеллектуальные процессы обработки знаний, а не данных (экспертные системы). • В зависимости от сферы применения различают следующие классы ИС. • Информационные системы организационного управления - предназначены для автоматизации функций управленческого персонала как промышленных предприятий, так и непромышленных объектов. Основными функциями подобных систем являются: оперативный контроль и регулирование, оперативный учет и анализ, перспективное и оперативное планирование, бухгалтерский учет, управление сбытом, снабжением и другие экономические и организационные задачи. ИС управления технологическими процессами (ТП) - служат для автоматизации функций производственного персонала по контролю и управлению производственными операциями. ИС автоматизированного проектирования (САПР) - предназначены для автоматизации функций инженеров-проектировщиков, конструкторов, архитекторов, дизайнеров при создании новой техники или технологии. Основными функциями подобных систем являются: инженерные расчеты, создание графической документации (чертежей, схем, планов), создание проектной документации, моделирование проектируемых объектов. Интегрированные (корпоративные) ИС - используются для автоматизации всех функций фирмы и охватывают весь цикл работ от планирования деятельности до сбыта продукции. Они включают в себя ряд модулей (подсистем), работающих в едином информационном пространстве и выполняющих функции поддержки соответствующих направлений деятельности. Таблица. Функциональное назначение модулей корпоративной ИС. Подсистема маркетинга Производственные подсистемы Финансовые и учетные подсистемы Подсистема кадров (человеческих ресурсов) Прочие подсистемы (например, ИС руководства) Исследование рынка и прогнозирование продаж Планирование объемов работ и разработка календарных планов Управление портфелем заказов Анализ и прогнозирование потребности в трудовых ресурсах Контроль за деятельностью фирмы Управление продажами Оперативный контроль и управление производством Управление кредитной политикой Ведение архивов записей о персонале Выявление оперативных проблем Рекомендации по производству новой продукции Анализ работы оборудования Разработка финансового плана Анализ и планирование подготовки кадров Анализ управленческих и стратегических ситуаций Анализ и установление цены Участие в формировании заказов поставщикам Финансовый анализ и прогнозирование Обеспечение процесса выработки стратегических решений Учет заказов Управление запасами Контроль бюджета, бухгалтерский учет и расчет зарплаты Таблица. Классификация рынка информационных систем Локальные системы Малые интегрированные системы Средние интегрированные системы Крупные интегрированные системы (IC) ·БЭСТ · Concorde XAL Exact ·Microsoft-Business Solutions - Navision, ·SAP/R3 (SAP AG) ·Инотек · NS-2000 Platinum PRO/MIS · Axapta D Edwards (Robertson & Blums) · Baan (Baan) ·Инфософт · Scala SunSystems ·MFG-Pro (QAD/BMS) ·BPCS (ITS/SSA) ·Супер-Менеджер · БЭСТ-ПРО ·SyteLine (COKAП/SYMIX) · Oracle Applications (oracle) ·Турбо-Бухгалтер · 1C-Предприятие ·Инфо-Бухгалтер · БОСС-Корпорация · Галактика · Парус · Ресурс · Эталон Классификация ИС в зависимости от уровня управления, на котором система используется. ИС оперативного уровня - поддерживает исполнителей, обрабатывая данные о сделках и событиях. Является связующим звеном между фирмой и внешней средой. Задачи, цели, источники информации и алгоритмы обработки на оперативном уровне заранее определены и в высокой степени структурированы. ИС специалистов - поддерживают работу с данными и знаниями, повышают продуктивность и производительность работы инженеров и проектировщиков. Задача подобных информационных систем - интеграция новых сведений в организацию и помощь в обработке бумажных документов. ИС уровня менеджмента - используются работниками среднего управленческого звена для мониторинга, контроля, принятия решений и администрирования. Основные функции этих ИС: • ·сравнение текущих показателей с прошлыми; • ·составление периодических отчетов за определенное время, а не выдача отчетов по текущим событиям, как на оперативном уровне; • ·обеспечение доступа к архивной информации и т.д. Стратегическая ИС - компьютерная информационная система, обеспечивающая поддержку принятия решений по реализации стратегических перспективных целей развития организации. Основная задача – это сравнение происходящих во внешнем окружении изменений с существующим потенциалом фирмы. С точки зрения программно-аппаратной реализации можно выделить ряд типовых архитектур ИС. Традиционные архитектурные решения основаны на использовании выделенных файл-серверов или серверов баз данных. Существуют также варианты архитектур корпоративных информационных систем, базирующихся на технологии Internet (Intranet-приложения). Следующая разновидность архитектуры информационной системы основывается на концепции "хранилища данных" (DataWarehouse) - интегрированной информационной среды, включающей разнородные информационные ресурсы. Для построения глобальных распределенных информационных приложений используется архитектура интеграции информационно-вычислительных компонентов на основе объектно-ориентированного подхода. Процесс создания ИС представляет собой процесс построения и последовательного преобразования ряда согласованных моделей на всех этапах жизненного цикла (ЖЦ) ИС. На каждом этапе ЖЦ создаются специфичные для него модели - организации, требований к ИС, проекта ИС, требований к приложениям и т.д. Модели формируются рабочими группами команды проекта, сохраняются и накапливаются в репозитарии проекта. Создание моделей, их контроль, преобразование и предоставление в коллективное пользование осуществляется с использованием специальных программных инструментов - CASE-средств. 3. Автоматизированные информационные технологии Преобразование документа в электронный вид делится на два этапа: получение графического образа документа и перевод графического образа в текстовый формат. Графический образ документа является результатом сканирования. Перевод графического образа документа в текстовый формат может быть произведен вручную или посредством автоматического распознавания. Сканирование - процесс оцифровки аналогового изображения (документ, фотография, иллюстрация, слайд) при помощи специального устройства, называемого сканером. Сканирование производится для получения, на основе оригинала, его цифрового "портрета", пригодного для компьютерной обработки. Сканер - оптико-электронное устройство для ввода в компьютер графических зображений. Сканер создает оцифрованное изображение документа и помещает его в память компьютера. Для работы с архивными документами в настоящее время используются, в основном, черно-белые и полутоновые монохромные сканеры. Это связано в первую очередь, с тем, что преобладающим типом архивного документа является текстовый документ, отпечатанный на пишущей машинке или монохромном принтере, с рукописным заполнением или правкой темными чернилами и эпизодически включающий печати, рисунки, схемы или черно-белые фотографии. Исходя из этого, в настоящей лекции будут рассмотрены только монохромные сканеры. Обзор сканеров для ЭА По характеру использования в технологическом процессе сканеры документов принято подразделять на следующие типы: 1. Планшетные 2. Протяжные или роликовые 3. Планетарные или книжные Планшетный сканер. Планшетный сканер - сканер, в котором оригинал кладется на стекло и сканируется при помощи подвижной линейной ПЗС матрицы. Прибор с зарядовой связью (ПЗС) - светочувствительная матрица сканера. Принцип ее работы состоит в том, что падающий на датчик ПЗС свет создает на нем электрический заряд, величина которого определяется интенсивностью падающего света. Измерение величины этого заряда и позволяет представить информацию о цвете в цифровом виде. Планшетные сканеры предназначены для ежедневного сканирования небольшого объёма фотографий, слайдов (при наличии слайд-адаптера) или документов (до 300 листов в день). Особенность данного типа сканеров - простота конструкции, ручная обработка документов, низкая производительность. Протяжной или роликовый сканер. Протяжной или роликовый сканер - сканер, в котором оригинал протягивается мимо неподвижной линейной ПЗС матрицы, разновидность такого сканера - факс-аппарат. Скоростной сканер для работы с документами - разновидность протяжного сканера, предназначенная для высокопроизводительного многостраничного ввода. Сканеры могут быть оборудованы подающими и приемными лотками объемом свыше 1000 листов, и вводить информацию со скоростью до 180 и более листов в минуту. Дополнительными возможностями, присущими данному типу сканеров, являются: 1. двустороннее сканирование (дуплекс) 2. подсветка оригинала разными цветами для отсечки цветного фона 3. система компенсации неоднородного фона 4. модули динамической обработки разнотипных оригиналов 5. надпечатывание отметки о том, что документ прошел обработку Скоростные протяжные сканеры предназначены для поточного сканирования (ввода) формализованных документов (бланки, накладные, картотеки и т.д.), а также обычных документов (договоры, письма, и т.д.) Особенность данного типа сканеров - повышенная надёжность конструкции, пакетная обработка документов, высокая производительность. Планетарный или книжный сканер. Планетарный сканер - устройство, в котором при сканировании оригинал неподвижен и располагается лицевой стороной вверх на значительном удалении относительно оптической системы и сканирующей линейной ПЗС матрицы сканера. Планетарные сканеры могут быть оборудованы специальными книжными колыбелями для удобного размещения фолиантов при сканировании. Данный тип сканера предназначен для сканирования скреплённых документов, периодических изданий и книг. Особенность планетарных сканеров - бесконтактный метод сканирования, нет необходимости расшивки оригиналов, большая производительность при оцифровке книг и сшитых оригиналов. Основные характеристики сканеров Разрешение (Resolution) - число точек или растровых ячеек, из которых формируется изображение, на единицу длины или площади. Чем больше разрешение устройства, тем более мелкие детали могут быть воспроизведены. Измеряется в "точках на квадратный дюйм" (DPI, dots per inch). Типовое разрешение промышленных сканеров - 200-300 DPI. Разрядность цвета (глубина цвета) - количество разрядов каждого пикселя в цифровом изображении, в т.ч. выдаваемом сканером. Описывает максимальное количество цветов, воспроизводимое сканером в виде степени числа 2. Одному разряду соответствует черно-белое изображение, 8-ми - серое полутоновое (типовое для рассматриваемых в данной лекции сканеров), 16-ти - цветное, 24-цветное изображение, наиболее близкое к человеческому восприятию (модель RGB), 36bit и больше - полноцветное изображение с высокой достоверностью цветопередачи, предназначенное для профессиональной работы, чаще всего в издательском деле. Время сканирования. Измеряется в страницах в минуту (иногда - в секундах на изображение). Типовые значения различны для разных типов сканеров и приведены далее в примерах. Формат. Формат сканируемого документа. Как правило - A3/A4. Интерфейс передачи данных - способ подключения сканера к компьютеру. Способы могут быть различны (к COM или USB порту, к SCSI карте и др.). Сканер обычно используется для решения следующих задач: 1. Перевод бумажного архива в электронный вид 2. Автоматизированная обработка формуляров 3. Ввод текущих поступлений документов в электронный архив Прочие характеристики: 1. Одно- и двухсторонний режимы сканирования 2. Формат оригиналов от 2,6х6 см до А3 3. Скорость сканирования 1. 90 стр./мин. (односторонний режим) 2. 180 стр./мин. (двусторонний режим) 4. Разрешение 200/240/300dpi. Программное обеспечение сканирования Существует три категории ПО сканирования: 1. ПО сканирование малых объёмов документов 2. ПО сканирования больших объёмов документов 3. ПО для специальных задач сканирования ПО сканирование малых объёмов документов. Применяется при домашнем и офисном сканировании. Используется практически любое программное обеспечение, совместимое со стандартом TWAIN и поддерживающее функцию сканирования - система управления документооборотом, программа распознавания графических образов или любой распространенный графический редактор. TWAIN (Toolkit Without An Interesting Name) - "инструментальный набор, для которого не удалось придумать интересного названия". Является стандартом для прикладного программного интерфейса (API) таких периферийных устройств, как сканеры, т.е. связующим звеном между компьютером и сканером. Примеры ПО сканирования малых объемов: 1. ABBYY FineReader 2. Adobe PhotoShop 3. Cognitive Cuineiform 4. Microsoft Photo Editor 5. ACDSEE ПО сканирования больших объёмов документов. Применяется при промышленном сканировании. При поточном сканировании один сканер ежедневно может обрабатывать до 50.000 и более документов. При таких нагрузках возможностей универсального стандарта TWAIN становится не достаточно, и для программного управления сканерами используется промышленный стандарт ISIS (ISIS - Image and Scanner Interface Specification). Примеры применяемого ПО: 1. Kofax Ascent Capture 2. Captiva InputAccel ПО для специальных задач сканирования. Применяется при планетарном, высококачественном сканировании. Программное обеспечение специально разрабатывается с учётом специфики сканирующего устройства, не совместимо с другими стандартами. Применяемое ПО: 1. ПланСкан BSC-2 2. RZ ProScan Book (Minolta PS7000 edition) 3. Zeutschel OmniScan Что такое системы распознавания? Чтобы реализовать автоматический или автоматизированный перевод бумажных документов в электронный вид, необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ, называемых системами оптического распознавания символов (Optical Character Recognition - OCR). Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения, переданного сканером, и распознавание каждого символа. Процессы анализа макета страницы: 1. определение областей распознавания 2. определение таблиц 3. определение картинок 4. выделение в тексте строк и отдельных символов и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы. Современные программно-аппаратные системы позволяют автоматизировать ввод больших объемов информации в компьютер, используя, например, сетевой сканер и параллельное распознавание текстов на нескольких компьютерах одновременно. Точность распознавания Ключевым параметром систем распознавания, характеризующим их практическую ценность, является точность распознавания, то есть процент правильно распознанных символов. OCR-системы могут достигать наилучшей точности распознавания — свыше 99,9% для чистых изображений, составленных из обычных шрифтов. На первый взгляд такая точность распознавания кажется идеальной, но уровень ошибок все же удручает, потому что, если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. То есть, если какого-то слова нет в словаре системы, то она по специальным правилам пытается найти похожее. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов. Точность распознавания падает за счет ошибок распознавания. Повышению точности распознавания способствует устранение указанных ниже причин ошибок. Причины ошибок при распознавании Встречающиеся в реальной жизни тексты обычно далеки от совершенства, и процент ошибок распознавания для "нечистых" текстов часто недопустимо велик. Грязные изображения — здесь наиболее очевидная проблема, потому что даже небольшие пятна могут затенять определяющие части символа или преобразовывать один в другой. Еще одной проблемой является неаккуратное сканирование, связанное с "человеческим фактором", так как оператор, сидящий за сканером, просто не в состоянии разглаживать каждую сканируемую страницу и точно выравнивать ее по краям сканера. Если документ был ксерокопирован, нередко возникают разрывы и слияния символов. Любой из этих эффектов может заставлять систему ошибаться, потому что некоторые из OCR-систем полагают, что непрерывная область изображения должна быть одиночным символом. Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR. Вопросы практического применения систем распознавания, а также проблем, вызванных недостаточной точностью распознавания, и путей их решения будут рассмотрены в следующей лекции, "Индексация и имиджинг". 4. Документальные информационные системы и информационно-поисковые языки. Лингвистические основы информатики. documentum - свидетельство. Первоначально им обозначали письменное подтверждение правовых отношений и событий. Им именуют объекты, содержащие на любом материальном носителе при помощи какой-либо знаковой системы информацию, предназначенную для хранения и передачи во времени и пространстве. Документ является основной единицей хранения и обработки документальных информационных систем. Исторически сложилось так, что за системами, ориентированными на работу с текстовыми документами, укоренился термин информационно-поисковые системы (ИПС). В отличие от традиционных баз данных, ориентированных на полное и точное представление данных достаточно простой смысловой структуры, документальные базы данных ориентированы на частичное, приближенное представление данных, имеющих более сложную смысловую структуру, представленных на входе в виде текста. Основной функцией любой документальной ИПС (ДИПС) является информационное обеспечение потребителей на основе выдачи ответов на их запросы. Осуществление выдачи системой требуемых данных реализуется с помощью главной операции ДИПС – проведения информационного поиска. Информационный поиск является процедурой отыскания документов, содержащих ответ на заданные потребителем вопросы. Проводится на основе поступившего от потребителя запроса. Потребность человека в определенной информации в процессе его практической деятельности носит название информационной потребности. Эту потребность невозможно однозначно выразить и описать, поскольку она постоянно меняется и трансформируется. Однако она может быть представлена в виде некоторой последовательности ее частных значений в фиксированные моменты времени. Такое частное значение информационной потребности представляет собой информационный запрос. При проведении информационного поиска в системе рассматривается не фактическая информационная потребность пользователя, а только информационный запрос, в ответ на который выдаются те или иные документы системы. Для выражения этих отношений в теории ДИПС введены два фундаментальных понятия: пертинентность и релевантность. Под пертинентностью понимается соответствие смыслового содержания документа информационной потребности потребителя. Документы, содержание которых удовлетворяет информационной потребности, называются пертинентными. Релевантность представляет собой соответствие содержания документа информационному запросу в том виде, в каком он сформулирован, а документы, содержание которых отвечает запросу потребителя, носят название релевантных. В состав типичной ДИПС входят четыре подсистемы: • Подсистема ввода и регистрации. • Подсистема обработки. • Подсистема хранения. • Подсистема поиска. Основные задачи подсистемы ввода и регистрации документов зависят от представления текстовых документов, поступающих на вход системы. Они могут быть представлены как в бумажном, так и в электронном виде. Поэтому эта подсистема решает следующие задачи: • создание электронных копий бумажных документов (например, сканирование с последующим распознаванием текста или ввод с клавиатуры); • обеспечение подключения к каналам доставки электронных документов; • распознавание, а при необходимости и преобразование формата электронных документов; • присвоение электронным документам уникальных идентификаторов (регистрация), а также ведение таблицы синхронизации имен (при необходимости сохранения прежних имен). Все поступающие документы без внесения в них каких-либо изменений направляются в подсистему хранения для сохранения в базе данных документов. База документов может представлять собой простую совокупность файлов, распределенную по каталогам жесткого диска. Однако такой тип представления базы документов характеризуется двумя недостатками: неэффективность использования дискового пространства и низкой скоростью доступа при большом количестве файлов. Поэтому для хранения документов применяют средства сжатия и быстрого поиска информации. В этом случае подсистема хранения представляет собой совокупность стандартных или специализированных средств архивации, управления данными, обеспечивающих возможность доступа к данным по предъявляемому идентификатору. На следующем этапе документы поступают на вход подсистемы обработки. Задачей этой подсистемы является формирование для каждого документа поискового образа документа (ПОД), в который заносится информация, необходимая для последующего поиска документа. ПОД сохраняется в индексе. При поступлении на вход системы запроса индекс преобразуется в поисковое предписание (ПП) и передается в подсистему поиска, задачей которой является отыскание в индексе ПОД, удовлетворяющих ПП с точки зрения критерия смыслового соответствия (КСС). Критерий смыслового соответствия (КСС) – это набор правил, по которым данная ДИПС определяет степень смысловой близости между поисковым образом документа (ПОД) и поисковым предписанием (ПП). Идентификаторы релевантных документов подаются с выхода подсистемы поиска на вход подсистемы хранения, которая осуществляет выдачу пользователю самих релевантных документов. Автоматизация процесса информационного поиска потребовала создания информационно-поисковых языков. Информационно-поисковый язык (ИПЯ) – это специально созданный искусственный язык, предназначенный для выражения содержания документов и запросов или описания фактов с целью их последующего поиска. ИПЯ создается на базе естественного языка, однако отличается от него компактностью, наличием четких грамматических правил и отсутствием семантической неоднозначности. Основными требованиями, предъявляемыми к ИПЯ, являются следующие: • однозначность: каждая запись на ИПЯ должна иметь только один смысл, одно толкование, а любое понятие, смысл должны получить единообразную запись средствами ИПЯ; • достаточная семантическая сила: способность отражать с необходимой полнотой и точностью смысловое содержание документов и запросов определенной предметной области; • открытость: обеспечение возможности корректировки языка. Каждый ИПЯ состоит из лексики (словарного состава), базисных (аналитических) отношений, грамматики, системы обозначений (алфавита), системы ведения (изменения и дополнения), правил образования и интерпретации. Все ИПЯ принято условно делить на классификационные и дескрипторные. Принципиальная разница между данными типами языков заключена в процедуре построения предложений (фраз) языка. В ряде языков в их лексический состав наряду со словами, выражающими простые понятия, заранее включены также словосочетания и фразы, выражающие сложные понятия. Для записи смыслового содержания сообщений из таких ИПЯ используются только отдельные элементы из этого набора, в том числе и готовые сложные понятия. Фактически построение сложных синтаксических конструкций заменяется выбором соответствующего сложного понятия из готового набора. Например: Политика. Внутренняя. Федеральная. Политика. Внутренняя. Региональная. … Политика. Внешняя… С помощью таких языков производится классификация сообщений, то есть отнесение их к классам, обозначенным лексическими единицами (ЛЕ) ИПЯ. Поэтому они получили название классификационных. В основе ИПЯ классификационного типа лежит систематическая классификация понятий, то есть классификация, отражающая смысловые отношения между понятиями. Классификацией называется распределение понятий (предметов или отношений) по классам на основании общего признака, присущего одним понятиям и отличающего их от других понятий. В классификации каждый класс имеет постоянное, определенное место относительно других классов. В основе классификации лежит деление понятий (предметов или отношений) на группы, которое носит относительно устойчивый характер. Признак, по которому производится распределение понятий, называется основанием деления. В классификациях непосредственно подчиняющее понятие называют родом, непосредственно подчиненное – видом по отношению к роду (родовому понятию). Такие отношения называют родовидовыми или иерархическими. Иерархические классификации используются для систематизации литературы и для ее поиска по систематическим каталогам в библиотеках. Для каждого предмета или темы в библиотечных системах предусмотрен соответствующий раздел или рубрика, то есть для всех понятий определенной предметной области, включающих разное число признаков, необходимо в классификационной таблице иметь перечень классов или подклассов. Рубрикатор является частным случаем классификационного ИПЯ. Кроме иерархических классификаций используются так называемые фасетные классификации. В их основу положено два принципа: разделение одного и того же множества предметов и явлений по разным основаниям, то есть выделение нескольких иерархических деревьев для одного и того же множества (категорий, фасетов); образование сложных индексов путем соединения простых индексов, фиксируемых в иерархических деревьях. В отличие от иерархических, в фасетных классификациях кроме основного деления на ряд классов осуществляется второе разбиение всего множества предметов и явлений по категориям или фасетам. Фасет – это признак или аспект одной категории, на основе которого группируются понятия в определенной отрасли знания. Внутри фасета устанавливаются иерархические отношения. В связи с большой трудоемкостью разработки они могут быть созданы только для узких предметных областей. Примером использования фасетной классификации является УДК – универсальная десятичная классификация. К ИПЯ классификационного типа относятся также алфавитно-предметные классификации. В них классы понятий (предметов, фактов, сведений) расположены в алфавитном порядке их имен. Они предназначены для узко предметного поиска документов и фактов, главная тема или предмет которой обозначаются соответствующим предметным заголовком (рубрикой). Они применяются в основном для индексирования книг и периодических изданий, а также для составления каталогов к библиотечным фондам и указателей к систематическим каталогам. Классификационные языки характеризуются одной особенностью: сложные понятия задаются заранее, до начала процедуры записи сообщений с помощью ИПЯ, образующие их слова также заранее связаны (скоординированы) определенными связями. Поэтому такие языки носят название предкоординируемых. Все ИПЯ классификационного типа характеризуются рядом свойств, обуславливающих низкую эффективность и затрудняющих их использование в информационном поиске, особенно с применением технических средств. К таким свойствам относятся: предварительная координация (связь) слов и словосочетаний в рубрике, трудность обновления и дополнения, практическая невозможность полной и детальной разработки схемы классификации, трудоемкость использования при индексировании. В языках дескрипторного типа лексические единицы заранее не связаны никакими текстуальными отношениями. Сложные синтаксические конструкции создаются в этих языках путем объединения (координации) ЛЕ во время процедуры представления смыслового содержания документов системы. Готовых фраз или предложений в таких языках нет, поэтому отсутствуют ограничения на составление сложных понятий. Такие ИПЯ носят название пост координируемые, поскольку координация между словами предложения возникает во время его записи. ИПЯ дескрипторного типа начали появляться в США в начале 50-х гг. Дескриптор произошел от слова dtscribe – описывать. В их основе лежит алфавитный перечень слов или словосочетаний. Содержание документов и запросов с помощью ИПЯ дескрипторного типа выражается в виде некоторого множества слов и словосочетаний естественного языка, являющихся своеобразными их координатами в некотором пространстве предметно-тематических признаков. В связи с этим дескрипторные ИПЯ называют языками координатного индексирования. В качестве лексических единиц в ИПЯ дескрипторного типа можно использовать значимые информативные слова, выбираемые непосредственно из индексируемых текстов. Такие слова и словосочетания называются ключевыми. Простейшим ИПЯ дескрипторного типа является язык, в котором словарь задан алфавитным перечнем ключевых слов без учета синонимии и различных отношений между словами. Одной из первых ИПЯ дескрипторного типа была система “Унитерм”, разработанная в 1952 году американским логиком и документалистом Мортимером Таубе. В этой системе был реализован предложенный им принцип координатного индексирования. Он представляет собой такой метод анализа информационного содержания документов, при котором поиск их осуществлялся путем логических операций умножения, сложения и дополнения, выполняемых над введенными в хранилище кодами. Термин “координация” относился при этом не к геометрическим осям координат, а к логической координации. В системе “Унитерм” в качестве индексов, описывающих содержание документов и запросов и координируемых при поиске, использовались ключевые слова, выбранные из их текстов, называемые унитермами. Ключевыми словами предлагалось считать отдельные слова и простые словосочетания. Выбранные из текста унитермы (единичные термины) располагались в алфавитном порядке в специальной картотеке. Словарный запас при этом формировался непосредственно в процессе их использования, а не разрабатывался предварительно. Такие ИПЯ открывали возможность для автоматического поиска. Они позволяли детально и многоаспектно раскрывать содержание любых документов; поскольку в них заранее не устанавливались никакие связи между ключевыми словами, они легко обновлялись и дополнялись, так как в алфавитный перечень ключевых слов можно было включить любое слово, встретившееся в тексте документа или запроса и необходимое для индексирования. Однако унитермные ИПЯ не устраняли основные недостатки естественных языков: неоднозначность слов и неформализованность связей. Поэтому возникала необходимость в лексикографическом контроле за ключевыми словами. Он осуществлялся с помощью специального нормативного словаря или информационно-поикового тезауруса. Структура таких тезаурусов достаточно сложна. Она включает в себя массив лексических единиц, словник, словарные статьи и указатели. ИПЯ, содержащий в себе информационно-поисковый тезаурус был создан под именем СИНТОЛ в 1960-62 гг. Основные тенденции развития ИПЯ направлены на их сближение с естественными языками. Можно также отметить работы по сопряжению традиционных библиотечно-библиографических классификаций с ИПЯ дескрипторного типа. 5. Гипертекстовые технологии поиска. Системы управления базами данных (СУБД). Банки данных. Основные понятия баз данных. База данных – это организованная структура, предназначенная для хранения информации. БД могут содержать различные объекты, но в основным объектом любой БД являются ее таблицы. Простейшая БД имеет хотя бы одну таблицу. Таблицы состоят из записей, каждая из которых, в свою очередь, состоит из полей. В записях содержатся сведения об объектах БД. Если в базе нет никаких данных (пустая база), то это все равно полноценная БД, и ее информацией является структура базы. Она определяет методы занесения данных и хранения их в базе. (Простейший вариант БД – деловой ежедневник, в котором каждому дню выделена страница. Даже если в нем не записано ни строки, он не перестает быть ежедневником, т. к. имеет структуру, четко отличающую его от другой бумажной продукции). БД – поименованная совместимость данных, организованная по определенным правилам. Эти правила включают общие правила описания, хранения и манипулирования данными. Для управления БД существуют специальные пакеты программ, называемые системами управления БД (СУБД). СУБД – это комплекс программных средств, предназначенных для создания структуры новой базы, наполнения ее содержимым, редактирования содержимого и визуализации информации. Основные задачи СУБД: 1. создание БД 2. осуществление связи м/у БД 3. создание запросов 4. создание отчетов и форм Под визуализацией информации базы понимается отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующая выдача на устройство вывода или передача по каналам связи. СУБД может рассматриваться как совокупность языковых средств и прикладных программ обслуживания. СУБД в зависимости от той модели данных, которую они поддерживают бывают: • иерархичными – имеют древовидную структуру • сетевыми – основаны на теории графов. М.б. связаны и не связ. м/у собой. • объектно-ориентированными • реляционными – от слова отношение. Отношение – двумерная таблица, содержащая данные об объекте. Объект называется – сущность. Реляционная модель некоторой конкретной области представляет собой набор отношений, изменяющихся во времени. Атрибут, поле — в реляционных базах данных элемент данных в кортеже. Схема отношения – список имен атрибутов в строго определенном порядке. Ключ – атрибут отношения однозначно идентифицирующий каждый кортеж. Первичный ключ может состоять из нескольких атрибутов. Такой ключ называется составным ключом. Кортеж - значение атрибутов, указанные в строго определенном порядке. Сравнительные характеристики СУБД В настоящее время для построения информационных систем применяются различные системы управления базами данных (СУБД), различающиеся как своими возможностями, так и требованиями к вычислительным ресурсам. Все многообразие применяемых СУБД, однако, можно свести к двум основным их классам: персональные и многопользовательские. К первому классу относятся СУБД, ориентированные для работы на персональном компьютере (dBASE, FoxPro, MS Access и т.п.). Изначально они поддерживали работу с данными только одного пользователя. Вся СУБД такого класса выполняется как единая программа, таблицы базы данных представляются отдельными файлами на диске того же персонального компьютера. С развитием локальных сетей разработчики СУБД этого класса стали приспосабливать их к работе в сетевой среде, в которой потенциально стало возможным организовать доступ к данным с нескольких персональных компьютеров, включенных в локальную сеть. Файлы базы данных при этом размещаются на файловом сервере. На каждом же рабочем месте работает собственная копия программы-СУБД и прикладная программа, и на их выполнение могут оказывать существенное влияние характеристики компьютера этого рабочего места. Таким образом, при наличии в сети N рабочих мест с одними и теми же данными работают N копий программы-СУБД, одними и теми же данными управляют сразу N копий СУБД. Ошибка в выполнении одной из копий не будет замечена другими копиями. При выполнении запросов к базе данных копия СУБД может либо производить поиск данных в удаленных файлах на файловом сервере, либо копировать все файлы, в которых ведется поиск в свою локальную файловую систему. В первом случае возникают проблемы одновременного доступа к данным при их изменении. Данные, над которыми производится изменения, должны быть заблокированы. Средства файлового сервера позволяют выполнять блокировку на уровне файлов, но не на уровне записей, что существенно снижает эффективность параллельной работы с базой данных многих пользователей. Во втором же случае, во-первых, требуется передача по сети больших объемов информации, а во-вторых, получается, что разные рабочие места работают с разными копиями данных и эти копии могут стать неидентичными. СУБД второго класса изначально создавались для выполнения на больших компьютерах и обеспечения параллельной работы многих пользователей. Такие СУБД, как правило, состоят из ядра, постоянно присутствующего в памяти (сервера) и большого количества программ-агентов, обслуживающих запросы конечных пользователей и прикладных программ (клиентов). В этом случае и ядро СУБД, и данные находятся на одном и том же компьютере. Одна копия СУБД управляет одной копией данных. Единая управляющая система позволяет эффективно организовать одновременный доступ к данным многих агентов, предотвращая конфликты между ними. Ошибка в работе СУБД локализована и может быть эффективно исправлена самой же СУБД. При работе в условиях сети ядро СУБД выполняет запросы агентов на выборку данных и передает по сети только результаты выборки. Поскольку быстродействие современных дисковых систем обычно выше, чем скорость передачи данных по сети, уменьшение объема передаваемых данных существенно увеличивает общую эффективность работы системы. При этом не накладывается никаких ограничений на масштаб сети, агенты могут быть связаны с ядром СУБД через любую сеть и любые протоколы передачи данных. Многопользовательские СУБД обладают также неоспоримыми преимуществами в таких аспектах, как надежность, безопасность, доступность. Многопользовательские СУБД с самого начала своей истории использовали в качестве интерфейса запросов язык SQL, отсюда произошло одно из их альтернативных названий - SQL-серверы. Хотя в последнее время подмножества SQL становятся доступными и в персональных СУБД, но в эти подмножества не включаются средства обеспечения безопасности и параллельного доступа к данным - те средства, которые персональные СУБД обеспечить просто не могут. При выборе базы данных очень важно выбрать базу данных, которая в наибольшей степени соответствуют предъявляемым к информационной системе требованиям, т.е. необходимо определиться какая модель автоматизации реализуется (автоматизация документооборота или бизнес - процессов). В первую очередь при выборе СУБД необходимо принимать во внимание следующие факторы: • максимальное число пользователей одновременно обращающихся к базе; • характеристики клиентского ПО; • аппаратные компоненты сервера; • серверную операционную систему; • уровень квалификации персонала. На сегодня известно большое число различных серверов баз данных SQL. В качестве вариантов построения системы остановимся более подробнее на серверных СУБД – Oracle и Microsoft SQL Server. Oracle Общая характеристика Oracle занимает лидирующие позиции на рынке СУБД и, что особенно важно, лидирует на платформах Unix и Windows. В России также обозначилось лидерство Oracle, особенно в области крупномасштабных информационных систем государственных структур. Фактически в нашей стране СУБД Oracle стала стандартом для государственных информационных систем. Причина широкой распространенности Oracle заключается прежде всего в высоких эксплуатационных характеристиках СУБД, большом количестве подготовленных отечественных специалистов по Oracle, наличию поддерживающей инфраструктры – учебных центров, широкой сети партнеров Oracle, большому числу технических курсов по Oracle в высших учебных заведениях и т.д. Так, только в Москве имеется более десятка учебных центров, предоставляющих широкий спектр технических курсов практически по всем линиям программных продуктов Oracle. Партнерская сеть по всей стране насчитывает более 160 организаций, что гарантирует поддержку ПО Oracle практически в любой точке страны. На русском языке уже издано достаточно много качественных книг по СУБД Oracle. Служба технической поддержки Oracle построена на профессиональной основе. В Центре технической поддержке в Москве работает более 20 сертифицированных технических специалистов, занятых только поддержкой пользователей Oracle (по телефону, электронной почте и с выездом к заказчику). Служба технической поддержки в России сертифицирована по стандарту ISO 9000. Важным является и то, что наряду с СУБД, компания Oracle поставляет центральный инфраструктурный продукт – Internet Application Server, сервер приложений, функционирующих в среде Internet/Intranet. СУБД Microsoft SQL Server Важнейшие характеристики данной СУБД - это: • простота администрирования, • возможность подключения к Web, • быстродействие и функциональные возможности механизма сервера СУБД, • наличие средств удаленного доступа В комплект средств административного управления данной СУБД входит целый набор специальных мастеров и средств автоматической настройки параметров конфигурации. Также данная БД оснащена замечательными средствами тиражирования, позволяющими синхронизировать данные ПК с информацией БД и наоборот. Входящий в комплект поставки сервер OLAP дает возможность сохранять и анализировать все имеющиеся у пользователя данные. В принципе данная СУБД представляет собой современную полнофункциональную база данных, которая идеально подходит для малых и средних организаций. Необходимо заметить, что SQL Server уступает другим рассматриваемым СУБД по двум важным показателям: программируемость и средства работы. При разработке клиентских БД приложений на основе языков Java, HTML часто возникает проблема недостаточности программных средств SQL Server и пользоваться этой СУБД будет труднее, чем системами DB2, Informix, Oracle или Sybase. Общемировой тенденцией в XXI веке стал практически повсеместный переход на платформу LINUX, а SQL Server функционирует только в среде Windows. Поэтому использование SQL Server целесообразно, по нашему мнению, только если для доступа к содержимому БД используется исключительно стандарт ODBC, в противном случае лучше использовать другие СУБД. В качестве примера СУБД, ориентированных для работы на персональном компьютере, подробнее остановимся на СУБД MS Access. СУБД MS Access Microsoft Office Access или просто Microsoft Access — реляционная СУБД корпорации Microsoft. Имеет широкий спектр функций, включая связанные запросы, связь с внешними таблицами и базами данных. Благодаря встроенному языку VBA, в самом Access можно писать приложения, работающие с базами данных. Основные компоненты MS Access: • построитель таблиц; • построитель экранных форм; • построитель SQL-запросов (язык SQL в MS Access не соответствует стандарту ANSI); • построитель отчётов, выводимых на печать. Они могут вызывать скрипты на языке VBA, поэтому MS Access позволяет разрабатывать приложения и БД практически «с нуля» или написать оболочку для внешней БД. Microsoft Jet Database Engine (англ.), которая используется в качестве движка базы данных MS Access является файл-серверной СУБД и потому применима лишь к приложениям, работающим с небольшими объемами данных и при небольшом числе пользователей, одновременно работающих с этим данными. Непосредственно в Access отсутствует ряд механизмов, необходимых в многопользовательских БД, таких, например, как триггеры. Работа в MS Access Объекты БД Access и их взаимосвязи MS Access называет объектами все, что может иметь имя (в смысле Access). В базе данных Access (файл .mdb) основными объектами являются таблицы, запросы, формы, отчеты, макросы и модули. В других СУБД, как правило, термин база данных относится только к файлам, в которых хранятся данные. В MS Access база данных включает в себя все объекты, связанные с хранимыми данными, в том числе и те, которые определяются для автоматизации работы с ними. Список основных объектов базы данных Access: 1. Таблица – объект, который определяется и используется для хранения данных. Каждая таблица включает информацию об объекте определенного типа, например, о клиентах. Таблица содержит поля (столбцы), в которых хранятся различного рода данные, например, фамилия или адрес клиента, и записи (строки), в которых собрана вся информация о некотором объекте (человеке, образце продукции и т.п.). 2. Запрос – объект, который позволяет пользователю получить нужные данные из одной или нескольких таблиц. Для создания запроса можно использовать запрос по образцу или инструкции SQL. Можно создать запросы на выборку, обновление, удаление или добавление данных. С помощью запросов можно также создавать новые таблицы, используя данные из одной или нескольких существующих таблиц. 3. Форма – объект, предназначенный для ввода, отображения данных или управления работой приложения. Формы используются для того, чтобы реализовать требования пользователя к представлению данных из запросов или таблиц. Формы можно также распечатать. С помощью формы можно в ответ на некоторое событие запустить макрос или процедуру. 4. Отчет – объект, предназначенный для создания документа, который впоследствии может быть распечатан или включен в документ другого приложения. 5. Макрос – объект, представляющий собой структурированное описание одного или нескольких действий, которые должен выполнять Access в ответ на определенное событие. Например, можно определить макрос, который в ответ на выбор некоторого элемента в основной форме открывает другую форму. В макрос можно включить дополнительные условия для выполнения или невыполнения тех или иных включенных в него действий. Можно также из одного макроса запустить другой макрос или функцию модуля. 6. Модуль – объект, содержащий программы на Visual Basic. Модули могут быть независимыми объектами, содержащими функции, которые можно вызывать из любого места приложения, но они могут быть и непосредственно «привязаны» к отдельным формам или отчетам для реакции на те или иные происходящие в них изменения. В таблицах хранятся данные, которые можно извлекать с помощью запросов. Используя формы, можно выводить данные на экран или изменять их. Формы и отчеты могут использовать данные непосредственно из таблиц или через запросы. Для выполнения вычислений и преобразования данных, запросы могут использовать встроенные функции или функции, написанные на Visual Basic. События, связанные с формами или отчетами, могут запускать макросы или функции и процедуры Visual Basic. (Событие – это любое изменение состояния объекта Access. Например, событием является открытие формы, ввод новой строки в форму, изменение содержимого текущей записи и т.д.). Для обработки события можно создать макрос или процедуру Visual Basic. С помощью макросов и модулей можно изменять ход выполнения приложения; открывать, фильтровать и изменять данные в формах и отчетах; выполнять запросы и создавать новые таблицы. В Visual Basic можно создавать, модифицировать и удалять любой объект Access, обрабатывать данные по строкам или столбцам, а также каким-либо другим способом. Из модуля можно вызывать библиотечные процедуры (DLL) Windows, чтобы использовать в приложении не только встроенные в Access функции, но и возможности Windows. С помощью страниц доступа к данным можно просматривать, добавлять, изменять и обрабатывать информацию, сохраненную в базе данных. Страницы доступа к данным также используются для объединения и группировки сведений, хранящихся в базе данных, для публикации сводок данных, анализа данных. Типы данных полей 1. Текстовый – макс. 255 байтов 2. Мемо – до 64000 байтов 3. Числовой – 1,2,4 или 8 байтов, для числового типа размер поля может быть следующим: • байт – целые числа от 0 до 255, занимает при хранении 1 байт • целое – целые числа от -32768 до 32767, занимает 2 байта, • длинное целое – целые числа от -2147483648 до 2147483647, занимает 4 байта, 4. с плавающей точкой – числа с точностью до 6 знаков от –3,402823*1038 до 3,402823*1038, занимает 4 байта, с точностью от –1,7977*10308 до 1,7977*10308, занимает 8 байтов 5. Дата-время – 8 байтов 6. Денежный – 8 байтов, данные о денежных суммах, хранящиеся с 4 знаками после запятой 7. Счетчик – уникальное длинное целое, генерируемое Access при создании каждой новой записи – 4 байта 8. Логический – логические данные 1бит 9. Поле объекта OLE – до 1 гигабайта, картинки, диаграммы и другие объекты OLE из приложений Windows. Объекты OLE могут быть связанными или внедренными. 10. Гиперссылки – поле, в котором хранятся гиперссылки. Гиперссылка может быть либо типа UNC (стандартный формат для указания пути с включением сетевого сервера файлов), либо URL (адрес объекта, документа, страницы или объекта другого типа в Интернете или Интранете). Адрес URL определяет протокол для доступа и конечный адрес. 11. Мастер подстановок – поле, позволяющее выбрать значение из другой таблицы или из списка значений, используя поле со списком. Чаще всего используется для ключевых полей. Имеет тот же размер, что и первичный ключ, являющийся также и полем подстановок, обычно 4 байта. (Первичный ключ – одно или несколько полей, комбинация значений которых однозначно определяет каждую запись в таблице. Не допускает неопределенных NULL значений, всегда должен иметь уникальный индекс. Служит для связывания таблицы с вторичными ключами других таблиц). Индексирование Индекс – средство ускорения операции поиска записей в таблице и, соответственно, других операций, использующих поиск: извлечение, модификация, сортировка и т.д. Таблицу, для которой используется индекс, называют индексированной. При отсутствии индексов сканирование записей таблицы осуществляется последовательно в порядке их физического размещения. Наличие индексов предполагает, что анализ записей производится в соответствие с возрастанием/убыванием значений полей, из которых сформирован индекс таблицы. Таким образом, индекс выполняет роль оглавления таблицы, просмотр которого предшествует обращению к записям таблицы. Атрибут (или набор атрибутов), который может быть использован для однозначной идентификации конкретной записи называется первичным ключом. Для ускорения доступа по первичному ключу во всех СУБД используется индексирование (применяется автоматически). В разных СУБД индексы реализованы по-разному (в локальных – как правило, в виде отдельных файлов), однако, принципы их организации одинаковы. Возможно, также индексирование отношения с использованием полей, отличных от первичного ключа. Данный тип индекса называется вторичным индексом и применяется в целях уменьшения времени доступа при поиске данных в таблице, а также для сортировки. Введение таких индексов не изменяет физического расположения записей таблицы, но влияет на последовательность просмотра записей. Наиболее популярным подходом к организации индексов в базах данных является использование техники B-деревьев. Это сбалансированное сильно ветвистое дерево во внешней памяти. • Сбалансированность. Длина пути от корня дерева к любому его листу одна и та же. • Ветвистость. Это свойство каждого узла дерева ссылаться но большое число узлов-потомков. Поиск в B-дереве – это прохождение от корня к листу в соответствии с заданным значением ключа. Заметим, что поскольку деревья сильно ветвистые и сбалансированные, то для выполнения поиска по любому значению ключа потребуется одно и то же (и обычно небольшое) число обменов с внешней памятью. При выполнении операций вставки и удаления свойство сбалансированности B-дерева сохраняется, а внешняя память расходуется достаточно экономно. Альтернативным подходом к организации индексов является использование техники хэширования. Общей идеей является применение к значению ключа некоторой функции свертки (хэш-функции), вырабатывающей значение меньшего размера. Свертка значения ключа затем используется для доступа к записи. Основным требованием к хэш-функции является равномерное распределение значения свертки. При возникновении коллизий (одна и та же свертка для нескольких значений ключа) образуются цепочки переполнения. Главным ограничением этого метода является фиксированный размер таблицы. В целом методы B-деревьев и хэширования все более сближаются. Связывание таблиц Многие СУБД при связывании таблиц автоматически выполняют контроль целостности вводимых в базу данных в соответствии с установленными связями. В конечном итоге это повышает достоверность хранимой в БД информации. Кроме того, установление связи между таблицами облегчает доступ к данным. Связывание таблиц при выполнении таких операций как поиск, просмотр, редактирование, выборка и подготовка отчетов обычно обеспечивает возможность обращения к произвольным полям связанных записей. Это уменьшает количество явных обращений к таблицам данных и число манипуляций в каждой из них. Между таблицами могут устанавливаться бинарные (между двумя таблицами), тернарные (между тремя таблицами) и, в общем случае, n-арные связи. Рассмотрим наиболее часто встречающиеся бинарные связи. При связывании двух таблиц выделяют главную и подчиненную таблицы. Логическое связывание таблиц производится с помощью ключа связи. Ключ связи, по аналогии с обычным ключом таблицы, состоит из одного или нескольких полей, которые в данном случае называют полями связи. Суть связывания состоит в установлении соответствия полей связи главной и подчиненной таблиц. Поля связи главной таблицы могут быть обычными и ключевыми. В качестве полей связи подчиненной таблицы чаще всего используют ключевые поля. зависимости от того, как определены поля связи главной и подчиненной таблиц (как соотносятся ключевые поля с полями связи), между двумя таблицами в общем случае могут устанавливаться следующие виды связи: • один-к-одному (1:1); • один-ко-многим (1:М); • многие-к-одному (М:1); • многие-ко-многим (М:М). Связь вида 1:1 образуется в случае, когда все поля связи главной и подчиненной таблиц являются ключевыми. Поскольку значения в ключевых полях обеих таблиц не повторяются, обеспечивается взаимно-однозначное соответствие записей из этих таблиц. Сами таблицы, по сути, здесь становятся равноправными. Связь 1:М имеет место в случае, когда одной записи главной таблицы соответствует несколько записей подчиненной таблицы. Связь М:1 имеет место в случае, когда одной или нескольким записям главной таблицы ставится в соответствие одна запись подчиненной таблицы. Вид связи М:М возникает в случаях, когда нескольким записям главной таблицы соответствует несколько записей подчиненной таблицы. В большинстве случаев любые две таблицы связаны отношением «один-ко-многим». Это означает, что любая запись в первой таблице может быть связана с несколькими записями во второй, однако любая запись второй таблицы связана только с одной записью в первой. Иногда возникает потребность разбить одну таблицу на более мелкие – проблема может заключаться в том, что некоторые сведения из нее используются не слишком часто, или в том, что какие-то данные не предназначаются для всеобщего доступа. Например, часть информации о факультетах нужна только для рекламных целей и используется очень редко. С другой стороны, сведения о заработной плате должны быть доступны только определенным сотрудникам. В любом из этих случаев можно создать отдельную таблицу и связать ее с исходной таблицей отношением типа «один-к-одному». Это означает, что любая запись в первой таблице связана только с одной записью во второй. Если же между таблицами необходимо организовать связь «многие-ко-многим», то в Access придется создать дополнительную таблицу пересечения, с помощью которой одна связь будет сведена к двум связям типа «один-ко-многим». Целостность БД Складывается из двух элементов: целостности данных и ссылочной целостности. Для обеспечения целостности данных требуется, чтобы все первичные ключи были уникальными в пределах одной таблицы, а для поддержания ссылочной целостности необходимо, чтобы всем значениям внешних ключей соответствовали значения первичных ключей базовых таблиц. Процесс нормализации (процесс по устранению дублирующихся данных) позволяет обеспечить целостность данных и ссылочную целостность, а СУБД и ваше приложение обязано поддерживать эту целостность при вводе данных. Отказ от обеспечения целостности может привести в худшем случае к полному разрушению всей базы данных. В Access имеется два метода обеспечения целостности данных, которые не зависят от типа приложений, использующих таблицы: 1. ключевое поле «Счетчик» (длинное целое значение), в котором значение либо увеличивается на 1, либо является случайным. 2. индексные поля первичного ключа со свойством «Да», т.е. совпадений не допускается. Поддержание ссылочной целостности требует строгого следования одному правилу: каждому полю внешнего ключа связанной таблицы должно соответствовать поле первичного ключа базовой или первичной таблицы. Это правило требует исключения следующих типов транзакций (транзакция – последовательность шагов обработки, приводящих к выполнению конкретных функций или действий; при этом весь набор действий воспринимается как одна единица работы): 1. Добавление записи в таблицу «многие», связанной с другой таблицей отношением «один ко многим», если в таблице со стороны «один» не имеется соответствующей записи. 2. Удаление записи из таблицы со стороны «один», связанной с другой таблицей отношением «один ко многим», если не удалены все связанные записи из таблицы со стороны «многие». 3. Удаление или добавление записи в таблицах, связанных отношением «один к одному» без одновременного добавления или удаления соответствующей записи в другой таблице. 4. Изменение значений поля первичного ключа базовой таблицы, связанных с записями подчиненной таблицы. 5. Изменение значения поля внешнего ключа связанной таблицы на значение, которого не имеется в поле первичного ключа базовой таблицы. Запись в связанной таблице с внешним ключом, значение которого не соответствует значению первичного ключа в промежуточной таблице, называется висячей записью. Для обеспечения ссылочной целостности необходимо использовать встроенные возможности Access, а не проверять целостность самостоятельно при добавлении данных в промежуточные таблицы или удалении информации из базовых таблиц. Функции Access Чтобы приложение можно было бы классифицировать как полную, функционально законченную систему управления базами данных, оно должно осуществлять следующие функции: 1. Организация данных. Включает в себя создание таблиц данных и управление ими. При создании таблиц, как правило, определяют свойства таблицы и полей. Каждая таблица имеет 5 обязательных свойств: • Описание – комментарий. • Условие на значение – требования к данным, вводящимя в поля записи. Используется для обеспечения целостности и непротиворечивости данных. • Сообщение об ошибке – позволяет выводить на экран сообщение, если введенные данные нарушают условие, определенное в свойстве «Условие на значение». • Фильтр – определяет подмножество записей, выводящихся после применения фильтра в таблице. • Порядок сортировки – определяет порядок сортировки записей в таблице. Значения свойств таблицы задаются в окне свойств таблицы, вызываемом командой «Свойства» меню «Вид» в режиме конструктора таблицы. Для поля необходимо установить следующие обязательные свойства: имя поля, тип данных, описание (комментарий), ключевое поле. Остальные свойства поля зависят от его типа данных и являются необязательными. Связывание таблиц и обеспечение доступа к данным. Access позволяет связывать таблицы по совпадающим значениям полей, с целью последующего соединения нескольких таблиц в одну временную таблицу. Access использует запросы для связывания таблиц и выборки из связанных таблиц данных, удовлетворяющих определенным условиям. Временные таблицы, создающиеся в результате соединения нескольких связанных таблиц, являются объектами класса RecordSet (набор записей, может быть динамическим, т.е. обновляемым, или статическим, т.е. только для чтения. Объекты класса RecordSet часто называют виртуальными таблицами, поскольку они не хранятся в базе данных, а при необходимости создаются в оперативной памяти). Добавление и изменение данных. Эта функция СУБД требует разработки и реализации представления данных, отличного от табличного представления. Для этого используются формы, позволяющие разработчикам приложений самим контролировать представление данных. Представление данных. СУБД должна позволять создавать отчеты на основе данных, хранящихся в таблицах или объектах RecordSet. В Access реализованы также дополнительные функции: 1. Защита базы данных. Эти средства позволяют организовать работу приложения в многопользовательской среде и предотвратить несанкционированный доступ к вашим базам данных Имеется возможность создавать рабочие группы пользователей и присваивать права доступа к данным как отдельному пользователю, так и группе в целом. 2. Макросы. Использование их позволяет автоматизировать повторяющиеся операции. 3. Модули. Процедуры и функции, которые можно использовать для сложных вычислений. Типы запросов в Access Существует несколько типов запросов. Запрос на выборку Извлекает данные, удовлетворяющие некоторым условиям, из одной или нескольких таблиц и отображает их в указанном порядке. Может использоваться для расчетов сумм, средних значений, количества записей и т.д. Помещает выбранные данные в динамический набор данных, т.е. при изменении данных в таблице, на которой основан запрос, данные в запросе автоматически изменяются. Запрос с параметрами Выводит каждый раз приглашение ввести значения заданных параметров. Это, например, позволяет каждый раз менять условие отбора без создания нового запроса. Например, нужно найти записи, в которых поле <Город> имеет значение <Москва>. Чтобы установить параметр, в бланке запроса в строке условие отбора нужного поля вводят имя или фразу, заключенную в квадратные скобки []. То, что внутри этих скобок Access рассматривает как имя параметра. Это имя выводится в диалоговом окне при выполнении запроса, поэтому лучше всего в качестве имени параметра использовать содержательную фразу. В данном случае условие отбора будет выглядеть следующим образом: = [Название города] В одном запросе можно задать несколько параметров, причем имя каждого параметра должно быть уникальным. Для параметра можно указать тип данных, чтобы использовать эту информацию для проверки введенного значения. По умолчанию присваивается текстовой тип. Иногда нужно, чтобы запрос с параметрами выбирал все записи в том случае, если пользователь не указал параметры. В таком случае условие отбора будет выглядеть следующим образом: Like "*" & [Название города] & "*" Если вы введете <МОСКВА>, то в качестве условия отбора будет использоваться строка: "*МОСКВА*" Если же вы не введете ничего, в качестве условия отбора будет использоваться строка "**". Можно создать запрос с параметрами, который запрашивает одну букву и выводит те записи, в текстовых полях которых хранятся строки, начинающиеся с этой буквы. Для этого используют такое значение: Like [введите букву] & "?*" Если вы хотите вывести записи в определённом интервале дат, то записываете: Between [Введите начальную дату] АND [Введите конечную дату] Перекрестный запрос Используется для расчетов и представления данных в структуре, облегчающей их анализ. Подсчитывает некоторые статистические значения, после чего группирует результаты в виде таблицы по двум наборам данных, один из которых определяет заголовки столбцов, а другой – заголовки строк. Созданная таблица называется перекрестной. Запрос для создания перекрестной таблицы создает статический набор данных, т.е. перекрестная таблица является неизменяемой. Для перекрестного запроса определяют только одно поле в качестве заголовка столбца, одно или несколько полей в качестве заголовка строки и одно поле значений. Порядок группировки записей определяется порядком следования полей в запросе. Первое поле, содержащее значение заголовки строк становится первым столбцом в перекрёстной таблице и определяет уровень группировки записей. Например: Заголовки строк: поля – клиент и получатель. Заголовки столбцов: год. Значение: стоимость заставки. Тогда записи сначала группируются по клиентам, а затем по получателям. Запрос на изменение За одну операцию изменяет или перемещает несколько записей. Типы запросов на изменение: на удаление, на добавление и обновление записей, на создание таблицы. Запрос на удаление записей. Удаляет выбранные записи из существующей таблицы. Такой запрос как правило содержит параметры. Например, вы будете удалять в таблице данные за какой-либо год и месяц. Т.е. вы используете 2 параметра: 1-й – год, 2-й – номер месяца. Тогда вы создаете запрос-выборку и включаете в условие отбора полей год и месяц соответствующие параметры. А затем сохраняете запрос-удаление с помощью команды Запрос/Удаление. Чтобы удалить записи, нажмите Запрос/Запуск. Запрос на добавление записей. Копирует выбранные поля и записи из одной таблицы в другую. Чтобы создать такой запрос, добавьте в бланк запроса таблицу, из которой будете выбирать данные для добавления. Затем выполнить команду Запрос/Добавление, и в диалоговом окне свойства запроса введите имя таблицы, в которую нужно добавить данные. Чтобы добавить записи, нажмите Запрос/Запуск. Запрос на обновление записей. Изменяет значение одного или нескольких полей в выбранных строках таблицы. Например, ваш конкурент поднял цены на какой-либо вид товара на 10%, вы можете увеличить свой доход, если поднимите цены на 8-9%. В базе данных вы должны во всех записях, где встречается данный вид товара, пересчитать стоимость этого товара. Для обновления группы записей сначала создают запрос на выборку, используя условие отбора, позволяющее выбрать те записи, которые необходимо обновить. Затем командой Запрос/Обновление запрос на выборку преобразуется в запрос на обновление и в бланке запроса появляется строка Обновление. Она используется для того, чтобы задать, как именно надо изменить данные, т.е. в нашем примере должны ввести формулу для перерасчета стоимости. Для обновления значений нескольких полей их включают в бланк запроса и определяют выражения, используемые для обновления этих полей. При этом для вычисления новых значений некоторого поля можно использовать значения других полей. Например, у вас в какой-либо таблице было поле Адрес, вы его переименовали в Адрес2, а потом создали поле Адрес1. А теперь хотите, чтобы в поле Адрес1 (если оно пустое) вставить информацию из поля Адрес2, и поле Адрес2 очистить. Для этого в бланке запроса на обновление переносите поля Адрес1 и Адрес2. Под полем Адрес1 в условии отбора помещаете выражение Is Null – для проверки, что это поле содержит пустое значение. В строке Обновление поля Адрес1 введите значение [Адрес2] ([] – обозначают, что вы вводите имя поля). Под полем Адрес2 в строке Обновление помещаете Null, чтобы сделать это поле пустым. Запрос на создание таблицы. Создает новую таблицу из одной или нескольких таблиц и помещает в нее выбранные данные. Использование такого запроса полезно в том случае, если надо накапливать итоговую информацию и долго ее хранить. Или, если исходные данные для запроса не меняются и в запросе участвуют несколько таблиц. Сохранение набора записей запроса как таблицы в этом случае позволяет ускорить доступ к данным. Чтобы превратить запрос в запрос на создание таблицы, надо выполнить команду Запрос/Создание таблицы и затем Запрос/Запуск, чтобы запустить запрос и поместить записи в новую таблицу. При создании новой таблицы Access копирует только основные свойства полей. Объединение. Это связь между полем одной таблицы (запроса) и полем другой таблицы (запроса) с тем же типом данных. Внутреннее объединение. Записи из двух таблиц объединяются только в тех случаях, когда значения в связанных полях совпадают. По умолчанию. Изменяемость запросов Запрос может быть изменяемым или неизменяемым. Запрос является изменяемым, если в него можно вводить новую информацию, которая изменит используемую в запросе таблицу. Установить возможность изменяемости запроса можно при просмотре запроса в режиме таблицы. Звездочка в области маркировки последней пустой записи указывает, что запрос является изменяемым. Соответственно в неизменяемом запросе данные редактировать нельзя. В число неизменяемых запросов включены следующие: • Перекрестные запросы, запросы объединения. • Запросы, в которых вычисляется сумма. • Запросы, в состав которых входят таблицы, не имеющие индексов или первичных ключей. • Запросы, на которые не распространяются права доступа на изменение или удаление записей. • Запросы, включающие несколько не связанных таблиц и запросов. • Запросы, в которых свойство Уникальные значения установлено в Да. Некоторые запросы позволяют изменять только определенные записи в таблице. В список полей, которые нельзя изменять, входят следующие: • Некоторые поля в запросах, основанных на таблицах с отношением один-ко-многим. • Вычисляемые поля. • Поля в базах данных, которые открыты с признаком только для чтения или содержатся на носителях, не позволяющих осуществить запись информации. • Поля, удалённые или заблокированные другим пользователем. • Мемо-поля или OLE-объекты, включенные в неизменяемый динамический набор данных, созданный SQL запросом. Работа со словарями данных После определения отдельных элементов данных, составляющих таблицы БД, и, установив отношения между ними, необходимо подготовить описание БД, называемое словарем (содержит информацию о базе данных в целом, обо всех таблицах, полях, о первичных и внешних ключах). В словаре также приводится назначение и описание каждого приложения, использующего БД. Стандартный словарь имеет иерархическую структуру и может быть создан в любом текстовом редакторе Windows. Например: База данных – полное название БД. Описание назначения и лиц, которые могут ею пользоваться. Список приложений, работающих с базой и информация о других базах данных, использующих данные из описываемой б.д. Область данных – название группы, к которой принадлежат таблицы. Если таблицы классифицируются по группам, н-р, финансовая группа, то включается описание каждой группы. Таблица – таблицы, входящие в область данных. Доступ – права пользователей на доступ к таблице. Запись – общее определение элементов данных. Первичный ключ – поле первичного ключа. Индекс – описание индекса первичного ключа. Внешние ключи – внешние ключевые поля. Индекс – индексы внешних ключей. Поля – неключевые поля. Допустимые значения для полей За каждым заголовком идет текст, описывающий назначение элемента БД, к которому относится заголовок. Последующие разделы словаря включают описание объектов, которые имспользуют таблицы БД, с подзаголовками для запросов, форм и отчетов. Изображения, снятые с экрана, и копии отчетов также добавляются в словарь данных. Распечатки кода программ также обычно приводятся в приложениях словаря. Подробные словари необходимы для обслуживания базы данных. Кроме того, описание словаря можно представлять в табличном виде. Интегрированный словарь данных – (надстройка Архивариус), которая впервые появилась в Access 2.0, позволяет создать отчет, где подробно описываются объекты и назначение их свойств для текущей базы данных. Во многих случаях Архивариус сообщит вам больше, чем вы хотите знать о БД, например, полный отчет обо всех объектах базы данных Борей составляет около 400 страниц. Однако чаще требуется поместить в словарь данных только информацию о таблицах и, возможно, запросах.

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

#Лекция

Информационные системы

Тебе могут подойти лекции