Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
История возникновения и развития информационно-аналитической деятельности
План лекции:
Введение
1. Дописьменные опыты отображения, свертывания, хранения и передачи знания
2. Истоки информационно-аналитической деятельности на этапах зарождения научного
знания.
2.1 Первое «методическое руководство» по анализу текста
2.2 Категоризация и предметизация знания.
2.3 Комментаторы и систематизаторы текстов в средние века.
2.4 Основы сравнительного логического анализа.
2.5 Основы сравнительного количественного анализа.
2.6 Библиографическая картина мира
3. Эпоха раннего книгопечатания (Возрождения).
4. Первые количественные исследования потока литературы в XVIII - начале XX вв.
5. Библиометрия, наукометрия, информетрия в 60-80-х гг. XX в.
6. Профессионализация подготовки обзоров.
7. Создание сети информационных центров.
8. Основные направления обзорно-аналитической деятельности.
9. Методические материалы 1960-1980-х гг.
10. Разработка автоматизированных систем анализа информации.
Литература:
Гордукалова, Г.Ф. Краткая история информационной аналитики // Анализ информации:
технологии, методы, организация: учеб.-практ. пособие. – СПб. : Профессия, 2009. – С. 3-49.
Введение
Современная информационно-аналитическая деятельность представляет собой ту часть
общественного производства знаний, которая связана с подготовкой информационных
обзорно-аналитических продуктов о природных, социальных, технических объектах и
процессах. Ее цель — получение выводного знания, оценка состояния и тенденций в развитии
объекта.
Специфика информационно-аналитической деятельности состоит в том, что аналитик
получает выводное знание без обращения к исследованию самого объекта, а лишь на основе
его информационного моделирования. Следовательно, информационная аналитика является
1
специфическим средством познания объектов разной природы на основе анализа и синтеза
уже известного, документализированного знания о них — «познание познанного».
Информационная аналитика может классифицироваться как одно из средств познания.
Поэтому искать истоки информационно-аналитической деятельности следует по всему
длительному пути истории науки, но выделять необходимо те опыты, когда для изучения
объекта осуществлялись какие-либо процедуры анализа известного знания о нем, без
обращения к самому объекту.
Информационная
аналитика
выделяется
в
самостоятельное
научно-практическое
направление только во второй половине XX в. До этого времени обзорно-аналитическая
деятельность была тесно соединена с процессом познания внешнего мира: при исследовании
объекта всегда осуществлялось сравнение уже известных сведений об объекте. В обзорноаналитической работе участвовали ученые, специалисты, библиографы, инженеры по
информации.
Для
истории
информационно-аналитической
деятельности
важно
проследить
формирование приемов информационного анализа текстов документов, а также увидеть, как
постепенно выделяется, специализируется деятельность информационного аналитика во всех
ее проявлениях. Специально предпринятые исследования обозначались как обзорноаналитические, количественные, статистические, библиометрические, информационные,
наукометрические и т. д. При их анализе необходимо видеть общие черты, объединяющие
такие исследования в целостное научно-практическое направление. Важно проследить
появление специальных методов и приемов анализа текстов, а также формы представления
целей и результатов обзорно-аналитической деятельности.
1. Дописьменные опыты отображения, свертывания, хранения и передачи знания.
Истоки информационно-аналитической деятельности можно найти в глубокой древности,
когда человек мыслящий стремился получить НОВОЕ знание об окружающем мире на основе
уже известных сведений о нем. Опыт постепенного познания мира, формы хранения
коллективного знания о мире в виде рисунков, мифов, сказаний, любых изустных преданий
привели к последовательному накоплению знания об окружающем мире. Такой путь
длительного собирания сведений Д. С. Лихачев называл «анфиладным» способом построения
знания, когда над существующим багажом знаний надстраивается очередная анфилада
хранилищ знания.
Древнее знание о мире синкретично и интегративно по своему характеру. Такими же были
и способы его отображения, хранения, передачи во времени: ритуальные танцы, наскальные
изображения, печати со сложным рисунком и краткой надписью. Они вбирали в себя знание о
2
мире, хранили и передавали его в течение 30 тысячелетий земной цивилизации. Они обучали
и «информировали». В них уже были заложены все основные функции и возможности
письменного документа. Использовались все доступные материалы — камень, глина, кость,
бронза. Каждый штрих, каждая нанесенная черта были значимы, информативны для древних
жителей Земли.
Первый опыт коллективного хранения знания — наскальные рисунки. Долгое время их
существование и повторяемость в разных центрах обитаемого мира объясняли проявлением
художественных начал древнего человека, рождением протоискусства. Лишь в 60-70-х гг. XX
в. появились первые предположения о древнепалеолитических рисунках как способе или
форме фиксации знания о мире.
Визуализация знания в древнем палеолите около сорока тысячелетий назад была вызвана
отсутствием каких-либо иных средств фиксации знания для длительного его сохранения.
Протоиндийские и более поздние месопотамские печати десятого — четвертого тысячелетия
до н. э. можно назвать первой, самой свернутой и визуальной формой хранения и передачи
знания: печати проставлялись на глиняных кувшинах, вносились в жилища, выступая самой
ранней «энциклопедией жизни». Изображения «экономно» и концентрировано отражали
представления о внешнем мире, полезное знание. Непросто дешифровать это знание, но
специалисты находят в маленьких фантасмагорических рисуночках календарь, основы
древней астрономии, представление древних жителей Земли о времени и пространстве, о теле
и душе, ранних системах счета. Основная цель — хранение знаний, а в географически
локальных масштабах — их передача в свернутой форме.
Параллельное развитие языка, появление в нем абстрактных понятий привели к приоритету
изустных каналов хранения и распространения знаний. Эпические сказы, мифы и легенды
складывались, отражая эмпирическое знание, полученное опытным путем, через наблюдение,
некоторое обобщение. Это знание было богато «иллюстрировано» мифотворческими
образами, а точнее — выражено через них.
О бережном хранении неизменяемого, медленно пополняемого знания свидетельствуют
два ярких примера:
В Древнем Востоке имена хранителей знания передавались из уст в уста. Они служили как
бы ссылками на источник сведений. Хронологически последовательный перечень имен
«хранителей-сказителей» за несколько столетий предварял сам текст предания. Были
отработаны такие приемы запоминания изустных текстов, которые позволяли сохранять и
одинаково воспроизводить даже интонации. Ритмичность текстов в виде песнопения
облегчала их восприятие, запоминание и воспроизведение.
Свидетельством могут также служить мифы индейцев о кораблях Колумба, записанные
3
лишь в начале XX в. Они воссоздавали «чертежи» оснастки кораблей настолько тщательно,
что их можно было бы построить.
Эти и иные примеры подтверждают возможность сохранения, накопления знания в первых
формах его представления и свертывания. Знание о мире практически не анализировалось, не
корректировалось, но обобщалось в свернутой изустной или визуализированной форме из-за
отсутствия иных способов хранения и «тиражирования» наблюдений. Практические навыки в
обработке камня, добыче красителей, обжига глины передавались от мастера к мастеру или
повторно «изобретались».
Во многих центрах древней земной цивилизации сложились достаточно торжественные
ритуалы передачи знания, хранители которого («художники» палеолита, старейшины
племени, позже жрецы) выделялись исполнением этой функции в особенную касту, были
первыми «библиографами», последовательно перечисляя «первоисточники» сказаний.
Воспринимающие изустное мифологизированное знание не только обучались ритуалам,
коллективным нормативам поведения: порождалось стремление понять и дополнить знание
об окружающем мире на основе уже известных сведений о нем.
2. Истоки информационно-аналитической деятельности на этапах зарождения
научного знания.
Изобретение письменности — ответ на нужды хранения и передачи сакрального,
ремесленного и зарождающегося научного знания о мире. От кратких записей письменная
цивилизация довольно быстро переходила к подробной фиксации событий и размышлений.
Изустные традиции сохранялись и копировались в зарождающемся документальном потоке,
но постепенно формировалась и собственная жанровая специфика письменных текстов.
Ранние жанры обзорных документов. В известных рукописных текстах III—IV тыс. до н.
э. отчетливо фиксируются три устремления:
увековечить деяния и события;
выразить «сокровенное знание» в максимально свернутой форме — изречения, емкого
образа, поговорки;
объединить имеющиеся знания — создать «книгу книг», «Песнь песней», собрать тексты
в библиотеке.
«Новостная лента» того времени выглядела различно: как надписи на стенах, в виде
бегающих по Афинам глашатаев с первой газетой - перечнем событий и указов. Важнейшие
события собирались в хроники событий, календари, летописи.
Стремление составить своды знаний породило эпические сказания, библейские книги,
энциклопедии, словари, книги о знаменитых мужах, «истории и жизнеописания»,
4
«библиотеки», антологии.
Ранние жанры обзорных документов (поучения, руководства, беседы) позже превращались
в учебники, «грамматики», «библиотеки». Для их подготовки потребовались разнообразные
приемы анализа предшествующего знания.
Классическим примером практической аналитики могут быть книги древнегреческого
историка Геродота, который был великим путешественником, но основным его вкладом в
историко-географическое знание оказался сбор, анализ и оценка существующих в то время
описаний путешествий, историко-географических книг. Он создал свою «Историю» на основе
«реферирования» существующих письменных документов. Оценки в источниках были
нередко субъективны, но Геродот стремился не пропускать противоречивых, с его позиций,
сведений об объекте. В его книге мы отчетливо видим три важнейших качества будущей
информационной аналитики: умение выделить противоречивые факты, сохранить их, дать им
оценку. Например, о солнце, встающем по пути в Индию «не с той стороны». Римлянин
Плиний Старший, описывая основу единственного дошедшего до нас его труда — «Естественной истории» в 37 книгах, сообщает о заимствовании им материала из более чем 2000
томов. Так почему же современный аналитик, который располагает гораздо большими
возможностями доступа к нужным текстам, не сможет отобрать, хорошо сложить полезный
обзорно-аналитический текст?
2.1 Первое «методическое руководство» по анализу текста. Первым теоретиком
информационной аналитики следует считать величайшего древнегреческого философа и
логика Аристотеля (384-322 гг. до н. э.).
Столь
не
глубокие
исследовались.
истоки
Поэтому
обзорно-аналитической
была
составлена
деятельности
краткая
антология
пока
еще
«История
информационной аналитики» как некоторый исторический экскурс в проблему выводного
знания.
Базовые правила получения выводного знания были сформулированы Аристотелем в
книгах «Первая аналитика», «Вторая аналитика» и других текстах «Органона» («орудие»,
«средство познания»). Если в ранней «Топике» и иных трактатах он отвечает на вопрос «Что
анализируется?», то во «Второй аналитике» Аристотель раскрывает основы получения
«выводного» знания. Для современного аналитика важны некоторые теоретико-методические
следствия:
1) Аристотель показал, что правильные рассуждения подчиняются небольшому числу
законов, независимых от частной природы объектов.
2) Аристотелевские законы тождества, противоречия и исключенного третьего — не только
основания для аналитики текста, но и перспективные сегодня направления для развития
5
специализированных технологий, которые могут быть встроены в анализ текста именно в этом
порядке.
3) Величие аристотелевского труда даже не столько в описании и обозначении
(кодификации) приемов анализа, сколько в том, что они сами стали объектом размышления —
началом формализации мыслительных процессов.
Аналитика Аристотеля рождена в противовес «мнимой мудрости», но она уже выступает
как средство анализа известного знания о предмете и получения нового, выводного знания о
нем. Он впервые открыл схемы рассуждения, схемы умозаключения, называя все это
«доказывающей (дедуктивной) наукой», аналитикой, «силлогизмами» — умозрениями.
4) Описаны
многие
приемы
поиска
«подобного»
и
отличительного
в знании, получения «соотнесенного» знания, построения утверждения, отрицания и
противоречия, умозаключения в целом. Поиск аналогий и противоречий — это тот путь,
который и сегодня еще не реализован информационной аналитикой в ее методических
изысканиях!
5) Аристотелем обозначена и исходная база для анализа, и основные методические приемы
анализа: «Всякое основанное на размышлении учение исходит из ранее имеющегося знания»,
а «для решения проблем следует выбирать расчленения и деления...».
О своем новом творении Аристотель с гордостью и полным правом первооткрывателя
заявлял,
что
об
аналитике
ранее
«в
наличии
не
было
ровно
ничего»!
Задумывалась же силлогистика Аристотелем именно как практическая аналитика, как
способ получения выводного знания на основе уже имеющегося.
Сохранению и развитию «Аналитик» Аристотеля мы обязаны его ученику Теофрасту (IV—
III вв. до н. э.), а также его комментаторам и последователям — Андронику Родосскому (I в.
до н. э.), Александру Афродисийскому (И-Ш вв. н. э.), Фемистию Пафлагонскому (IV в. н. э.),
критикам — Хризиппу (III в. до н. э.), биографу Диогену Лаэртскому (III в. н. э.), а также
переводчикам и писцам.
2.2 Категоризация и предметизация знания. Во многих центрах древнего обитаемого
мира постепенно формировался поток обобщающих и оригинальных исследований в двух
направлениях — мировоззренческие труды и основы отдельных отраслей знания —
математики, истории и географии, риторики и др. Поражает широкий тематический охват
авторских работ, высокая продуктивность отдельных ученых того времени, уже сложившаяся
предметная организация знаний в VI в. до н. э.
Складывался язык научного исследования. В этой связи были популярными в то время
работы «о категориях», раскрывающие логические принципы образования родовых и видовых
6
понятий. В третьем веке Порфирий написал «Введение в „Категории" Аристотеля», которое
служило учебником в средневековой Византии и Западной Европе. Истолковывая «пять
звучаний» — род, вид, отличительный признак, существенный признак и случайный признак,
Порфирий закладывал методические основы и для информационного анализа. Он предложил
также наглядную схему, которая была известна как «древо Порфирия» и отражала
родовидовые отношения понятий в строгой иерархии. Этот подход ровно через шестнадцать
столетий будет положен в основу десятичной классификации, а позднее — дескрипторных
словарей и анализа предметного поля объекта.
Первые же из известных нам классификаций датируются VIII в. до н. э. Это систематики
Платона, Аристотеля, Каллимаха. В них, а особенно в аристотелевской классификации наук,
мы уже видим логически выдержанное трехтактное подразделение знания. Основные классы
(философия теоретическая, практическая, поэтическая) детализируются на отдельные отрасли
знания (этика, экономика, политика) с последующими подрубриками, выстроенными от
общего к частному.
Каллимах, составляя свой знаменитый библиографический труд «Таблицы тех, кто
прославился во всех областях знания и того, что они написали» в 120 книгах, существенно
детализирует классификационную схему до 120 делений в целом. Этим он предвосхищает
иные библиотечно-библиографические опыты. В результате была рождена самая свернутая
форма о накопленном знании - классификационная схема, которая сейчас является основным
средством информационного моделирования любой предметной области в информационноаналитической деятельности.
Римские энциклопедисты Марк Теренций, Варрон, Марциан Капелла, Кассиодор, Августин
и др. составляли собственные классификационные системы, в которых они подразделяли
знание на 79 классов-направлений.
Таким образом, на этапах ранней письменности и зарождения научного знания рукописные
источники информации дифференцировались по предметам отражения и целевому
назначению. Выделились основные жанры рукописей обзорного характера: поучения,
руководства, беседы, энциклопедии, антологии, «библиотеки». Они уже различались
формирующимися типовыми элементами и структурой текстов. Главное — были заложены
основные приемы анализа предшествующего знания для получения нового — анализ
высказываний, сравнение, классификация знания, включая его предметизацию. Наиболее
свернутой
формой
передачи
знания
о
мире
в
эти
времена
следует
признать
классификационные схемы, а для отдельных текстов — изречения, образные выражения,
пословицы и поговорки, которые отражали не только социальные нормы, но и знание о
мироустройстве.
7
2.3 Комментаторы и систематизаторы текстов в средние века. В непростой период
перехода к средневековой науке существенно изменяются условия ее существования. После
трех веков гонений в 313 г. христианам было даровано право исповедовать свою религию
открыто и свободно, но усугубились гонения на «зловредные учения». Если в начале века
перечислялись только 22 «ереси», то в 375 г. в «Домашней аптечке» Епитафия Саламинского
предлагались средства против 156 (!) учений. Церковь латинизируется, нарастает
размежевание между Западом и Востоком. Тонкий исследователь психологии личности
Августин намечает тематическую философскую триаду «бог – мир – человек». Она оставалась
актуальной для всей эпохи Средневековья. Одновременно, именно с «Исповеди» Августина,
начинается столь значимый для европейской культуры интерес к «биографии» души, к вопросам реализации индивидуальности.
Практически до середины средних веков процесс познания в целом носил описательный
характер ОБЪЕДИНЕНИЯ известных данных в целостную картину, комментирования
оригинальных трудов. Многие авторские работы носили обзорно-реферативный характер, что
позднее стало характерным и для первых научных журналов. Именно поэтому толкователи,
комментаторы могут считаться первыми «аналитиками-практиками» в истории нашей
цивилизации.
Представителями практической аналитики в средние века следует также назвать
систематизаторов и переводчиков авторских текстов. Они накопили обширнейший опыт в
анализе и интерпретации авторского творчества. Многие их методические достижения
значимы и для современного аналитического процесса. Так до настоящего времени
комментарии к текстам остаются одной из задач научного издания художественных,
философско-религиозных и иных сложных текстов. Современная герменевтика — это особое
направление в теории и практике познания, имеет своей целью объяснение трудных тестов
через понятное. Наряду с общим гносеологическим подходом к текстам, постепенно
выделяются филологические, социально-психологические и коммуникативные аспекты
анализа и комментирования текстов и символов.
Среди знаменитых средневековых комментаторов трудов Аристотеля известны Боэций (VI
в.), неоплатоник Симплиций (VI в.), первый крупный «аристотелик» на Востоке Абу Юсуф
ибн Исхака аль-Кинди (IX в.), историк науки и создатель классификации наук древности Абу
Наср аль-Фараби (X в.). Многие из комментаторов были одновременно и переводчиками текстов, разъясняли и «адаптировали» их.
В начале VI в. последний представитель античной философии и одновременно «отец
средневековья» Боэций написал комментарии к сочинениям Порфирия, Платона и
Аристотеля. Европейский мир в период раннего средневековья заполоняли разного рода
8
«компендиумы» — краткие энциклопедии, справочники, компиляции, бревиарии. Безусловно,
для информационной аналитики это бесценный опыт отбора и «свертывания» знания, хотя и
существенно упрощающий накопленное знание. Боэций — сторонник доступной мудрости и
одновременно противник интеллектуальных «заменителей» — трепетно заботился о
«полнейшей достоверности» перевода. Для информационного аналитика это остается
предельно важным профессиональным постулатом.
И второе — общенаучное достижение, выросшее сейчас в весьма знаменательную
проблему: Боэций задался великой целью показать глубинное единство двух учений —
Платона и Аристотеля, соединить две часто противопоставляемые вершины. Нас же в этой
истории волнует проблема соединения «логоса» и «мифа» — логического и чувственного
познания и место последнего в работе информационного аналитика. Эта проблема остается
открытой: информационный аналитик не может обращаться к самому объекту, исследовать
его каким-либо образом, он лишь сравнивает через формализованные приемы тексты об этом
объекте. Но можем ли мы исключить восприятие объекта, профессиональную интуицию
аналитика вовсе из рассмотрения? Каким правилам должен следовать аналитик, чтобы не
переступать границы от анализа знания к исследованию объекта, но все же получать выводное
знание и новые, синтезированные сведения о нем?
Боэций
перевел
на
латинский
язык
«Категории»,
«Топику»,
«О
софистских
опровержениях», «Первую» и «Вторую» аналитику Аристотеля. Он составил комментарии к
«Категориям», к собственному переводу «Первой» и «Второй» Аналитик, а также
прокомментировал работу главного комментатора Аристотеля «Введение» Порфирия.
Кинди написал «Трактат о количестве книг Аристотеля и о том, что необходимо для
усвоения философии». Он отделял подлинные тексты Аристотеля от приписываемых ему, был
зачинателем «восточного аристотелизма».
Благодаря этому через века формировались целые школы учеников и последователей,
передавалось и обогащалось знание об аналитике, постепенно наращивался опыт анализа
сложных высказываний и текстов. Интересен и факт появления аналитиков более узкой
специализации. В частности, выдающегося мыслителя Прокла (412-485 гг.) называют
«систематизатором неоплатонизма» — элитарного интеллектуально-мистического учения. До
настоящего времени систематизация идей — одна из нерешенных проблем в информационной
аналитике, имеющая и более универсальное значение для развития семантического интернетпоиска.
Просмотр трудов по истории средневековой науки и ряда оригинальных трудов авторов
того периода позволяет выделить некоторые достижения в области анализа текстов, важных
для подготовки обзорных документов.
9
В теории познания:
1. Уточнены и детализированы требования к определению понятий, заложенные
мыслителями античности (например, произведение Боэция «Об определении»).
2. Стал привычным классификационный ряд объектов, выстраиваемый при изучении
объекта (сочинения аль-Фараби «О классификации наук», «Об изменчивых вещах»).
3. Формируются учения о мыслительной деятельности человека уже с высокой оценкой
потенциала умственных возможностей индивида. Например, учение о потенциальном
интеллекте аль-Фараби с выделением «деятельного и благоприобретенного интеллекта», его
представление о способах возникновения образов предметов.
В методике анализа:
1. Значительно
расширился
круг
свойств
объектов,
характеризуемых
в текстах, требующих сравнительного логического анализа (например, книга Боэция «О
различии»).
2. Стали
использоваться
индивидуального
авторского
количественные
творчества.
меры
для
(Диоген
характеристики
Лаэртский
темы,
сообщил,
что
труды Аристотеля составляют 400 книг и 1000 трактатов из 445 270 строк. Одна книга Иосифа
Флавия занимает 20 книг 60 000 строк).
3. Богаче
дифференцированы
представления
об
истинных
и
ложных
рассуждениях («О значении слова «интеллект» аль-Фараби).
Эти достижения не всегда были известны современникам, но они воспринимались
последователями, определенными группами в научном сообществе либо повторно
изобретались в какой-либо период времени.
2.4 Основы сравнительного логического анализа. Новый и принципиально значимый для
аналитики методический шаг к выводному знанию был сделан на заре Возрождения. В XIIIXIV вв. испанский философ и богослов Раймунд Луллий занимался проблемами логического
следования,
пытаясь
моделировать
логические
операции
с
помощью
системы
концентрических кругов. Главную задачу он видел в том, чтобы «научить людей выводить
новые сочетания терминов на основе подобранных таблиц. Это предвосхищение фасетноблочного подхода в информационном анализе и первая прямая ориентация не просто на
выводное, а именно новое знание о мире. Позднее Ньютон создаст свои «предсказательные»
таблицы, Менделеев сделает открытие на основе сводной таблицы базовых свойств
химических элементов, а информационные аналитики будут использовать сопоставительные
таблицы как основной и разнообразный профессиональный инструментарий.
Развитие естествознания и математики, начиная с XVII в., вызвало интерес к методам
познания, природе математических понятий и аксиом, логике доказательств. Это выразилось
10
в обсуждении дискурсивного и интуитивного знания. Под дискурсивным понималось обычно
знание
рассудочное,
логическое,
выводное.
Интуитивное
знание
—
чувственное,
непосредственное, созерцательное. Учение об интеллектуальной интуиции позволяло
Декарту, Лейбницу, Спинозе удерживать рационалистические позиции. Рене Декарт в своей
книге «Правила для руководства ума» (1701) сформулировал 4 основных правила
«рационалистического» метода:
• истинно то, что представляется ясным и отчетливым;
• сложное необходимо расчленять на частные проблемы;
• к неизвестному восходить от известного и доказанного;
• вести логическое рассуждение последовательно и без пропусков.
Эти правила могут служить основой методических указаний для информационных
аналитиков, но с существенной поправкой на уровень и динамизм анализируемых
современных текстов.
В многовековой «дискуссии» участвовали мыслители разных школ и направлений.
Англичанин Томас Гоббс (1588-1679) характеризовал понятия как отражение в сознании
реально существующих тел, как мир «бестелесных субстанций». Джон Локк (1632-1704),
английский философ, член Лондонского королевского общества в «Опыте о человеческом
разуме» (1690) предложил теорию образования общих идей. Идеей он считал все, что ум
замечает в себе и что есть непосредственный объект восприятия, мышления или понимания.
При этом утверждал, что положительные идеи являются результатом отрицательных причин
(например, дефицит информации, кризисная ситуация для аналитика).
Немецкий философ и математик Г. В. Лейбниц (1646-1716) сформулировал четвертый
закон достаточного основания для нахождения эмпирических или случайных истин: «Ничто
не происходит без достаточного основания». Этот закон можно считать главным принципом
открытий и изобретений, а в информационной аналитике основой для поиска причинноследственных связей, разматывая их клубок даже по одному «неосторожному» слову в тексте.
Россия внесла свою лепту через работы всепримиряющего и практически мудрого М. В.
Ломоносова, определившего свое восприятие познания в «Кратком руководстве к
красноречию». По его мнению, источник понятий — объективный мир, никаких «врожденных
идей» не существует, а единственное средство познания — опыт, эксперимент, но в единстве
анализа и синтеза, индукции и дедукции. Близкая синтетическая позиция была характерна и
для А. И. Герцена, видящего истину в соединении опыта и теории, анализа и синтеза,
органичном соединении индуктивных и дедуктивных построений. Из специальных
логических работ интересны для аналитиков книга М. И. Карийского «Классификация
выводов», вышедшая в 1880 г., и сочинение Л. Рутковского «Основные типы умозаключений»
11
(1899).
Развитие символической логики позволило позднее перейти от изучения некоторых
тривиальных правил преобразования информации в человеческом мышлении к общим
правилам ее преобразования в природе, обществе, мышлении. Такие задачи уже решали
школьники и студенты, знакомые с исчислениями высказываний. Был усовершенствован
метод умозаключений, позволяющий формальным образом плести самую сложную
логическую сеть, которая на словесном уровне может быть недоступна человеку.
2.5 Основы сравнительного количественного анализа. Из бурных XVIII-XIX столетий в
качестве значимых для методики информационной аналитики выделим часть творческого
наследия позитивистов, приверженцев как бы только индуктивного метода, основателей
«эмпирической логики» У. Уэвеля, Д. С. Милля. У. Уэвель оставил цикл работ в области
количественных методов (именно для прикладных целей!), которые сегодня активно
используют информационные аналитики: метод кривых роста, средних арифметических для
индикаторов, метод наименьших квадратов, метод остатков.
Главное в их наследии — это опыт описания методов, сочетающих количественные и
качественные приемы анализа:
• метод градации (изучения непрерывных перемен);
• метод естественной классификации, значимый для обработки фактографических
массивов.
Английский логик и экономист Д. С. Милль (1806-1873) обстоятельно разработал 5
методов исследования причинной связи между явлениями. Эти методы индуктивного анализа
применялись и ранее. Он их осмыслял под влиянием 5 правил английского астронома, физика
и математика Дж. Гершеля, у которого правила имели самый общий и статичный вид,
например, неизменность связи причины и следствия. Д. С. Милль определяет пять первичных
стратегий, которые вошли во многие учебники логики и в историю познания под именем
«методы Милля»:
1. Метод согласования, сходства построен на выявлении общих факторов или свойств,
имеющих место в аналогичных ситуациях. Связующее их обстоятельство он называет
причиной (или содержащим в себе причину) наблюдаемой тенденции.
2. Метод отличий подразумевает поиск элемента или свойства, который присутствует в
момент достижения результата, но не является неотъемлемой частью в нормальном развитии
ситуации или явлении.
3. Объединенный метод согласования и отличий – «контрастный анализ» включает
прослеживание тех свойств объекта, которые всегда сопутствуют определенному результату
и всегда отсутствуют в тех случаях, когда результат не достигнут.
12
4.Метод сопутствующих изменений – это выявление тех свойств, которые прямо или
обратно пропорционально изменяются в прямой или обратной связи успешному результату.
5.Метод остатка (или процесс исключения) предполагает поиск той связи между
свойством объекта и частью результата его изменения, которая авансирует и другие связи остальной части результата и другими свойствами объекта.
2.6 Библиографическая картина мира. Оценочное отношение к рукописной книге
длительное время слабо дифференцировалось на «хорошие и плохие», «плоды разного сорта»,
«истинные и ложные» книги. В целом же бытовало общее «сверхположительное» восприятие
книг как основного источника знания, которые непременно нужно хранить, учитывать как
ценное имущество. Например, при угрозе пожара бытовало незыблемое правило — «иконы и
книги выносити».
К моменту изобретения книгопечатанья в Европе уже сложились и иные условия,
предполагающие библиографический учет рукописного наследия. Расширялся не только круг
образованных людей и географических центров письменной цивилизации, но и возрастала
продуктивность отдельных ученых и мыслителей, закрепляющих свои достижения в
рукописях.
Продуктивность средневековых авторов специально не анализировалась, но отдельные
примеры высокой продуктивности легко находятся в обеих эпохах — и до, и после
изобретения книгопечатания.
Эпоха раннего средневековья. Общее количество сочинений философа арабского халифата
аль-Фарби (870-950) колеблется в пределах 80-130, в том числе многотомных рукописей.
3.Эпоха раннего книгопечатания (Возрождения).
Итальянский мыслитель, математик, врач и астролог Кардано Джироламо (1501-1576), известный своим парадоксальным выводом «знаю, что душа бессмертна, но не знаю как», в 1573
г. сжег свои 120 работ. Однако в 1663 г. были изданы 10 больших томов его 138 работ,
занимающих 7000 страниц. Кроме специальных, среди них «Пять книг о мудрости», «О
природе», «Загадки вечности», «О разнообразии вещей» (1557) — грандиозная по объему
работа (66 печатных листов). Он самоуверенно утверждал, что число разрешенных им
существенных проблем доходит до 40 тыс., а «более мелких указаний я оставлю после себя
более двухсот тысяч.
Объем накопленного мирового массива рукописных и печатных изданий к XVI в. составлял
примерно
400-414
тыс.
названий.
Это
обосновывает
закономерность
широкого
распространения во всех развитых центрах цивилизации библиографических сводов рукописей
и
печатных
изданий.
библиографических
Перечень
трудов
можно
значительных
найти
в
отечественных
энциклопедии
и
зарубежных
«Книга».
Развернутая
13
характеристика крупнейших библиографических указателей по всем странам мира с
синхронистическими таблицами представлена в книгах К. Р. Симона («Иностранная
универсальная библиография» (1940); «История иностранной библиографии» (1963)) и Г. Г.
Кричевского («Общие библиографии зарубежных стран» (1962)).
В XVII в. задумываются и во многом осуществляются масштабные замыслы
международной библиографии. В результате освоен массив книг и рукописей, совокупно
включающий не менее 900 тыс. названий.
В этот период широко составляются перечни произведений «знаменитых мужей»,
биобиблиографические словари, списки работ отдельных жанров, описание фондов
библиотек, распространяются книготорговые каталоги.
Резко обогащают документальный поток периодические издания. Это стимулировало
развитие новых форм свертывания информации: библиографических обозрений новой
литературы, рецензий на новые издания («критическая библиография»). В целом первые
научные журналы носили обзорно-реферативный характер, развивая формы оценочных
(рекомендательных) аннотаций, развернутых рефератов.
XIX столетие – это золотой век методики и практики библиографической деятельности. Во
многих странах мира организуются библиографические отделы в крупнейших библиотеках,
центры текущей библиографии, выходят в свет учебники и методические пособия по
библиографии. Обществу становятся известными сотни имен составителей. Благодаря их
творческим поискам сложились весьма близкие методические требования к библиографическому
описанию
и
аннотированию
изданий.
Стабилизируется
выход
национальных текущих библиографических изданий, существующих до настоящего времени,
которые не только сами моделируют документальный поток государств с определенной
степенью подобия, но и создают надежную базу для информационного анализа.
Это позволило библиографии занять самостоятельное место в науке, создавать
собственную библиографическую картину мира.
Библиографические своды следует рассматривать как первичную и важнейшую форму
свертывания документализированного знания о внешнем мире, как библиографическую
модель накопленного и развивающегося знания. Был создан собственный профессиональный
инструментарий библиографического описания документов, поиска, отбора, аннотирования,
систематизации и иных форм свертывания сведений о документах.
4. Первые количественные исследования потока литературы в XVIII - начале XX в.
Существенный вклад в развитие информационной аналитики внесли исследователи
документального потока, изучающие закономерности его развития и использования с
14
помощью количественных (частотных) методов, когда фиксировалась частота появления в
потоке документов с определенными признаками.
Уже в первых библиографических трудах составители осознавали диагностические начала
библиографических пособий. Теоретически предсказывалась возможность анализа «книжного
рынка» и «истории литературы». В. Г. Анастасевич, В. С. Сопиков, Г. Л. X. Бакмейстер прямо
говорили о том, что библиографическое изучение изменяющейся совокупности книг позволит
судить о «недостатках» и «дальнейшем развитии науки».
Подобные исследования начались задолго до появления термина «библиометрия» в XVIIIXIX вв. Как правило, они проводились книгоиздателями, библиографами. Первым называют
опыт К. X. Фремихена, который осуществил анализ книготорговых каталогов ярмарки в
Лейпциге.
В России академики А. Шторх и Ф. Аделунг в 1810 г. показали уже практический образец
количественного
подхода.
Они
статистически
анализируют
собственный
указатель
отечественной литературы «Систематическое обозрение литературы в России: 1801-1806 гг.»,
полагая «усмотреть из оного состояние каждой особенной науки», «сравнивать один период с
другими и через сравнение это видеть приращение или ущерб литературы»!
В своем исследовании А. Шторх и Ф. Аделунг по удивительно многоаспектной методике
показали «сколько сочинений напечатано в каждом роде» по наукам, видам изданий, жанрам,
а также с каких языков сделаны переводы. Измерен даже авторский коллектив: 366 писателей
19 сословий, из которых «10 князьев, 6 графов, 3 министра». Авторы были рассмотрены по
ученому званию, сословию (10 студентов, 1 вольный крестьянин), полу и национальности —
«5 женщин, из них одна немка». Показано распределение статей по названиям журналов и
даже сделана попытка рекомендаций и «претензий».
Очевидно, что выдвигались масштабные аналитические задачи с желанием регулярно
проводить количественный анализ потока новой литературы. Практические опыты П. И.
Кеппена (1825 г.), В. И. Межова (1860 г.), К. Беккера (1868-1869 гг.), Л. И. Павленкова (18871896 гг.) и, особенно, Н. М. Лисовского (1895-1905 гг.) показывают, как зарождалось
стремление дать объективную основу суждениям о развитии науки, разработать методику
сбора и обработки данных. Предложения об изучении «достоинств и ущерба каждой науки»
через анализ потока новых изданий предвосхищали идеи информационного прогнозирования
и «пробельного» анализа.
Как правило, были представлены статистические показатели частоты встречаемости
документов определенного признака — тематики, жанра, места опубликования, тиража,
стоимости, даже формата издания. Заложенные в анализ признаки были разнообразны, но
практика сравнения, обобщения и интерпретации полученных данных еще не была
15
значительной.
Именно эти опыты вводят в профессиональный оборот новую форму свертывания
сведений о развитии потока литературы, его структурных связях. Оценивая их, А. М.
Ловягин называл их «специальной библиолого-статистической точкой зрения». Он предлагал
создавать
картограммы,
отражающие
состояние
потока
изданий,
опережая
идею
картографирования науки, реализованную в ИНИ США Ю. Гарфильдом через 70 лет.
В первой половине XX в. отечественными специалистами были предвосхищены и другие
мировые открытия. Академик Н. Я. Марр с сотрудниками в 1920-е гг.составляют первый
указатель цитированной литературы по востоковедению, к чему придут только через 60 лет в
США. Н. А. Рубакин вводит понятие «книжный поток», предлагает изучать его «приливы» и
«отливы», рассматривать поток книг как «литературное зеркало жизни».
За рубежом изучение документального потока в 1920-1950-х гг. ведется в нескольких
направлениях. В 1934 г. библиограф Лондонской научной библиотеки С. К. Бредфорд
открывает закономерность рассеяния профильных публикаций в периодических изданиях.
Дж. Ципф к 1949 г. успешно проводит лингвостатистические исследования. Регулярно
анализируется видовой состав документального потока. В 1956 г. Д. Прайс предложил концепцию экспоненциального роста документального потока, а Р. Бартон и Р. Кеблер в 1960 г.
вводят показатель «период полужизни» документа (half-life) для измерения темпов старения
научно-технической литературы.
Открывается эпоха бурных количественных исследований документального потока, что
приводит к выделению «статистической библиографии», а затем к активному развитию
библиометрии и наукометрии.
5. Библиометрия, наукометрия, информетрия в 60-80-х гг. XX в.
В этот период впервые проводится информационно-логический анализ научного
исследования. Четко осознается и активно исследуется концепция науки как информационной
системы (В. В. Налимов (1969 г.); Г. М. Добров (1970 г.); А. Д. Урсул (1971 г.) и др.).
Обсуждается проблема «информационного взрыва—информационного кризиса».
В стране выходят первые монографии по количественному исследованию науки,
документального потока. Главное в том, что в этот период вводится представление о
«следящих системах» на основе многих заказных исследований документального потока по
сложнейшим областям физики, электроники, металлургии и т. д. группой научноисследовательского сектора под руководством В. А. Минкиной, Э. Е. Рокицкой, Г. В.
Гедримович.
Для научного сообщества С. Г. Кара-Мурза и С. А. Рожнов четко обозначают возможности
16
формализованных методов «документальной» аналитики в оценке новых научных
направлений.
Осуществлены опыты «пробельного анализа», сленгового и частотного контент-анализа
текстов.
Статистические методы стали использоваться для автоматизированной обработки
результатов библиометрических исследований, накоплен опыт картографирования науки на
основе потока цитированной литературы.
Постепенно складываются несколько направлений-школ в исследовании документального
потока, обозначенных как «наукометрия», «библиометрия», «информетрия». Почти три
десятилетия не прекращались споры о соотношении этих понятий, а соответственно и стоящих
за ними исследований. Подробный историографический и сравнительный анализ этих понятий
приведен в работах О. Воверене, A. Pritchard, F. Lara, L. Egghe. Специалисты пришли к выводу
о полном совпадении в используемых методах, поэтому предлагалось разграничивать данные
направления лишь по предмету и цели исследования. Однако вопрос о границах библиометрии
не простой. В эти годы проведены сотни масштабных эмпирических исследований с разными
целями, разной методикой, в разных сферах научно-профессиональной деятельности. Их
объединяет три черты: они осуществляются на основе количественных измерений известной
информации об объекте с целью оценки его состояния. При этом невозможно кардинально
разграничить метрические исследования по признакам специфики объектов, методов и базы
исследований. Более того, в 1960-1980-х гг. стали создаваться метрические направления в
разных отраслях знания: социометрия, эконометрия, технометрия, биометрия, математическая
лингвистика
и
др.
В
них
закладывались
основы
измерения
известного,
документализированного знания о предметной области для оценки состояния и прогноза ее
развития.
В настоящее время формируется новое направление — сетеметрия (вебометрия,
сайтометрия, киберметрия), вобравшее в себя опыт библиометрических исследований и
осуществляющее их в сетевом режиме. Появление сетеметрии — оперативного
количественного измерения и анализа потоков информации — вначале было встречено весьма
оптимистично. Писали о создании нового инструмента и новой измерительной науки. Лишь в
середине 1990-х гг. был сделан вывод о том, что принципиально отличного от библиометрии
в новом направлении найти невозможно. К сожалению, до настоящего времени сетеметрия
развивается скорее как технический инструмент управления потоками информации в сети,
нежели средство семантического их анализа.
Таким образом, коротко просмотрев основные события библиометрических исследований
за два бурных столетия, мы видим одно из базовых начал информационного анализа —
17
частотный анализ и долговременные аналитические устремления библиографии. Сейчас они
органично вложены в общую технологическую цепочку, как на уровне количественного
изучения микропотока документов, так и анализа текстов.
6. Профессионализация подготовки обзоров.
Уже в преддверии описанных событий осознается острая необходимость систематической
подготовки обзоров.
Общим следствием нарастающих темпов научно-технического развития (электронновычислительной техники, космических полетов и др.) в 1960 г., наряду с проблемой
автоматизации процессов индексирования, реферирования и поиска информации, является
профессионализация подготовки обзорных документов. В числе основных признаков
выделения
обзорно-аналитической
деятельности
в
качестве
самостоятельной
профессиональной сферы деятельности следует назвать:
внимание специалистов к проблемам обзорно-аналитической деятельности;
создание сети информационных центров в мире и стране с функциями аналитикосинтетической переработки информации (АСПИ);
значительное увеличение числа серийных обзорно-аналитических изданий;
разработка теоретико-методических основ обзорно-аналитической деятельности и
подготовка кадров;
самостоятельный библиографический учет обзорных материалов.
Понятие «обзор» входит в профессиональную лексику как обозначение самостоятельной
формы представления сведений о публикациях по теме. В 1958 г. Е. И. Шамурин вводит
определение
этого
понятия
в
«Словарь
книговедческих
терминов»:
обзор
—
«синтезированный текст, в котором дается сводная характеристика какого-либо вопроса или
ряда вопросов, основанная на использовании информации, извлеченной из некоторого
множества отобранных для этой цели первичных документов за определенное время. Обзор
необязательно должен представлять собой самостоятельный документ. Им может быть лишь
часть документа (обычно вводная)». При этом обзор уже трактуется не только как жанр
научной и публицистической литературы, но и как самостоятельная часть библиографической
продукции.
С 1962 г. специалисты ВИНИТИ приступили к подготовке продолжающегося,
многоотраслевого обзорно-аналитического издания «Итоги науки» с публикацией обзоров по
важнейшим проблемам и отраслям в области естествознания и техники. С 1964 г. выделяется
самостоятельная
рубрика
«Информационный
анализ»
в
РЖ
«Научно-техническая
информация». Во второе, многократно переведенное во многих странах мира, издание «Основ
18
информатики» ее авторы, основатели российской информационной науки А. И. Михайлов, А.
И Черный, Р. С. Гиляревский, вводят подраздел «Обзоры». В нем определены исходные
требования к аналитическим и реферативным обзорам, которые характеризуются как
конечный результат «аналитико-синтетической и логической переработки первичных
документов».
За рубежом проводятся специальные сравнительные исследования количества обзорных
публикаций, круга их создателей. Изменяется отношение к межотраслевой информации,
вводится представление о «плотности информации», уточняются признаки обзора и его
разновидности.
В 1968 г. физик К. Херринг публикует статью «Потонуть в потоке информации или
отобрать существенное: необходимость в обзорах», которая тут же переводится на русский
язык (Успехи физ. наук. 1969. Т. 98, № 2). Подготовка обзоров на фоне открытия
экспоненциальных темпов развития документального потока становится главной идеей этих
лет.
К началу 1970-х гг. сложилась общепринятое выделение трех основных типов обзоров —
библиографические, реферативные, аналитические (критические в США и Великобритании).
Существенная часть обзорных материалов готовилась по инициативе редакций научных и
научно-популярных журналов (около 47%), появлялась в материалах конференций, книгах,
научных отчетах (около 32%).
Несмотря на достаточно четкий основной классификационный ряд (библиографические,
реферативные,
аналитические
обзоры),
отечественные
специалисты
неоднократно
возвращались к проблеме их практического распознавания и классификации. В 1974 г. была
защищена первая в стране диссертация Д. И. Блюменау «Обзор как вид научно-технической
литературы и источник информации».
Обзоры были дифференцированы по различным классификационным признакам:
Постепенно осуществлялся переход к методическому аспекту подготовки обзоров в
органах НТИ.
Специалистами
отраслевой
науки
также
обсуждалась
проблема
эффективного
использования обзоров и обзорных изданий.
Регулярно вспыхивала дискуссия о квалификации составителей обзоров. Неоднократно
выдвигались организационные и принципиальные вопросы о месте обзорной информации в
системе НТИ.
7. Создание сети информационных центров.
В разных странах мира процесс организационного оформления информационных центров,
19
служб и подразделений на предприятиях, которые выдвигали перед собой самостоятельную
задачу подготовки обзорно-аналитической продукции, протекал в период 1920-1960-х гг.
весьма неравномерно. Как правило, создавался базовый информационный центр или институт
документации с государственным финансированием, которому предписывалась функция
библиографирования и реферирования текущего потока литературы. По мере развития и
накопления массивов реферативной информации, многие из них выделяли группы анализа
информации.
В ведущих странах мира реализовывались государственные программы по созданию
аналитических служб, центров анализа информации. Так, в США к 1968 г. действовали центры
анализа информации, финансируемые федеральным правительством. В нашей стране
подобные функции исполнялись сотрудниками отраслевых академических институтов. Они
решали, прежде всего, собственные исследовательские задачи, но и весьма активно
занимались прогнозно-аналитическими исследованиями.
К 1977 г. в мире было отмечено возникновение нового типа организаций —
«информационно-консультирующих», которые сегодня называются консалтинговыми,
консультационными фирмами, а также появление «экспертов-посредников».
Активно дополняли поток зарубежных обзорно-аналитических материалов в этот период
времени профессиональные общества, объединения и ассоциации, научные фонды, научные и
профессиональные издательства.
В нашей стране была создана масштабная Государственная система научно-технической
информации
(ГСНТИ),
включающая
звенья
государственного,
территориального
и
отраслевого подчинения. С середины 1960-х гг. задачи обзорно-аналитической деятельности
решали:
общегосударственные (всесоюзные) институты научной информации;
центральные
отраслевые
институты
научной
информации
и
экономических
исследований;
многоотраслевые республиканские институты научной информации;
межотраслевые региональные центры научно-технической информации;
центры анализа информации (специализированные информационные центры);
информационные подразделения в научно-исследовательских и проектных институтах,
на предприятиях (ЦБТИ — центральные бюро технической информации, ОНТИ — отделы
научно-технической информации), в задачи которых входило составление тематических
подборок литературы по постоянно действующим запросам, обзорных справок, реже аналитических и реферативных обзоров;
библиотеки, участвующие в библиографировании потока литературы, готовящие
20
библиографические обзоры и указатели;
отдельные профессиональные общества и ассоциации, редакции научных и
аналитических серийных изданий.
Центральное
место
в
системе
информационного
обеспечения
заняли
ведущие
информационные центры государственного подчинения. Первые научно-информационные
органы были созданы уже в 1921 г. (Коминолит, Научно-технический отдел ВСНХ, Бюро
иностранной науки и техники (БИНТ)).
Наибольший опыт обзорно-аналитической деятельности был накоплен во всесоюзных
информационных центрах, существующих до настоящего времени.
В 1952 г. открылся Институт научной информации, преобразованный в 1955 г. во
Всесоюзный (ныне Всероссийский) институт научной и технической информации —
ВИНИТИ РАН, который стал центром обзорно-аналитической работы в стране.
Чуть позднее подключились к работе центры, специализирующиеся на работе с патентной
информацией (ЦНИИПИ), стандартами (ВНИИКИ). Непубликуемые документы — отчеты
НИР и ОКР, диссертации и препринты — концентрировал в своих фондах ВНТИЦ, а переводы
зарубежной литературы — ВЦП. Эти центры создавали исчерпывающие фонды своих документов
и
до
настоящего
информационными
времени
фондами,
являются
включая
общегосударственными
подготовку
справочно-
обзорно-аналитической
информации по запросам.
В 1969 г. государственная система научно-технической информации была дополнена
созданием Института научной информации в области общественных наук (ИНИОН РАН),
который стал головным в области обзорной информации для гуманитарных и социальных
наук.
В эти годы была сформирована сеть республиканских институтов НТИ и территориальных
центров
научно-технической
информации
(ЦНТИ),
которые
формировали
поток
межотраслевых обзорно-аналитических материалов. Из 117 созданных центров наиболее
активно занимались анализом информации
республиканские центры
БелНИИНТИ,
УкрНИИНТИ, АзНИИНТИ, а также ведущие территориальные центры Ленинградский,
Волгоградский, Кемеровский ЦНТИ.
В период 1938-1976 гг. формировалась подсистема отраслевых и ведомственных центров,
которые до настоящего времени готовят обзорно-аналитические материалы. В создании сети
всесоюзных отраслевых институтов научной информации можно выделить три этапа:
На первом этапе происходила отраслевая специализация органов НТИ в 1938-1959 гг.
Начальной точкой в 1938 г. было создание старейшего в стране центра в области
электротехнической
промышленности
(Информэлектро),
который
длительное
время
21
лидировал по многим вопросам информационно-аналитической работы. В тяжелый, но уже
переломный период Великой Отечественной войны, в 1943 г. начинают работу
информационные центры угольной промышленности (ЦНИЭИуголь), черной металлургии
(Черметинформация), строительства и архитектуры (ВНИИС). В послевоенные годы
достраивается основной контур жизнеобеспечивающих и перспективных для экономики
страны отраслей: цветной металлургии (ЦНИИцветмет экономики и информации, 1951 г.), в
1959 г. — химической промышленности (НИИТЭХИМ), легкой промышленности
(ЦНИИТЭИлегпром), пищевой промышленности (ЦНИИ-ТЭИпищепром).
На втором этапе в 1962-1968 гг. система отраслевых центров уже активно и
целенаправленно
достраивалась:
начали
работу
институты
в
области
лесной
и
деревообрабатывающей промышленности (ВНИИПИЭИлес-пром, 1962 г.), медицины и
здравоохранения (ВНИИМИ, 1963 г.), нефтяной промышленности (ВНИИОЭНГ, 1962 г.),
сельского хозяйства (ВНИИТЭИСХ, 1964 г.), машиностроения (НИИМАШ, 1964 г.),
химического и нефтяного машиностроения (ЦИНТИхимнефтемаш, 1964 г.), автомобильной
промышленности (НИИНавтопром, 1964 г.), строительных материалов (ВНИИЭСМ, 1964 г.)
и др. Новый виток развития сети центров последовал в 1967 г., когда были созданы центры
газовой промышленности (ВНИИЭгазпром,
(ЦНИИатоминформ,
1967
г.),
1967
г.),
атомной
сельскохозяйственной
энергетики
техники
(ЦНИИТЭИгоскомсельхозтехники СССР, 1967 г.), мясной и молочной промышленности
(ЦНИИТЭИмясомолпром, 1967 г.), средств автоматизации и систем управления (ЦНИИТЭИ
приборостроения, 1967 г.), энергетики и электрофикации (Информэнерго, 1968 г.) и др.
На завершающем этапе (1972-1976 гг.) создавались институты информации в области
торговли и общественного питания (ЦНИИНТЭИторговли, 1972 г.), энергетического
машиностроения (НИИЭинформэнергомаш, 1975 г.). Активно готовили и издавали обзоры и
обзорные материалы по актуальным вопросам своей отрасли центры в области медицины,
сельского хозяйства, строительства и архитектуры, химии и химической промышленности.
Таким образом, практически все важнейшие отрасли науки и техники имели собственный
отраслевой центр информации, который в большинстве случае создавал обзоры по
важнейшим проблемам и направлениям, запросам соответствующих министерств.
В эти годы стали работать информационные центры по отдельным отраслям культуры —
кинематографии, печати, высшему образованию. В 1972 г. был учрежден Информационный
центр по культуре и искусству в составе Государственной библиотеки СССР им. В. И. Ленина
(ныне — Российская государственная библиотека (РГБ)) Информкультура.
Параллельно в 1956-1976 гг. была создана сеть из 24 центральных бюро и информационных
центров, старейшими из которых были ЦБНТИ Минмонтажспецстроя СССР (1956 г.) и
22
ЦБНТИ Минавтотранса (1957 г.).
Известный западногерманский документалист Э. Питч оценивал созданную систему
информационных
органов в
СССР
как наиболее жизнеспособную
из
множества
существующих в мире - и по структуре, и по основным принципам деятельности.
В
ряде
ведущих
научно-исследовательских
центров
работали
информационно-
аналитические отделы. Например, Отдел анализа, обобщения и распространения опыта
художественного конструирования ВНИИ технической эстетики (1963 г.).
Определенный
вклад
в
обзорно-аналитическую
деятельность
обеспечивали
и
представители сети торгово-промышленных палат в регионах, которая существенно
активизировала свою работу в постперестроечный период времени.
В совокупном потоке ежегодно были представлены не менее 5 тыс. обзорных документов
различного объема и тематической направленности, из которых около трети распространялись
в открытой печати, а остальные передавались организациям-заказчикам по их запросам.
Многие из них не только полезны для ретроспективного анализа тенденций развития предметных областей, но и сохраняют научно-практическое значение до настоящего времени.
Существенно новым явлением в 1960-е гг. была организация центров анализа информации
в ведущих странах мира.
Центр анализа информации (ЦАИ) — организация или структурное подразделение,
специально созданные с целью накопления, отбора, хранения, поиска, оценки, анализа и
синтеза информации в определенной предметной области.
Сам термин «центр анализа информации» (Information analysis center, Centre of information
analysis) был предложен Дж. Симпсоном (США) в 1964 г., широко распространился позднее,
благодаря деятельности Секции по центрам анализа информации под руководством Э. Брэди.
Прямой довод для жизнедеятельности таких центров привел Э. Брэди в своем докладе группе
советских специалистов: доля ненадежной, некорректной по методике получения,
практически бесполезной, а иногда и даже вредной дезориентирующей информации в научнотехнической литературе, по оценкам американских специалистов, составляет не менее 50%, а
в отдельных отраслях науки и техники достигает даже 80%.
По замыслу Дж. Симпсона, главная задача таких центров — это своевременная подготовка
авторитетными специалистами обзоров — оценочных, аналитических, монографических или
характеризующих достигнутый уровень развития (state-of-the-art type).
К задачам ЦАИ в этот период относились: подготовка библиографических указателей и
списков, выдача копий первичных документов, составление списков новых поступлений.
В числе источников информации уже тогда фигурировали не только опубликованные
документы, но и личные и непубликуемые документы.
23
Обязательным условием существования ЦАИ являлась тесная связь с группой
специалистов предметной области, активно участвующей в отборе и анализе информации.
Вопрос о создании самостоятельных центров анализа информации в стране выдвигался,
начиная с середины 1970-х гг. Однако к этому времени уже функционировала масштабная и
многозвенная государственная система органов научно-технической информации, на которую
возлагались и задачи обзорно-аналитической деятельности. Конечно, далеко не все
информационные
службы
выполняли
эти
задачи
качественно
из-за
отсутствия
квалифицированных кадров, достаточного финансирования, существующей политической
установки.
Автоматизированные
технологии
информационного
поиска
и
анализа
разрабатывались лишь ведущими органам НТИ, владеющим большими и средними ЭВМ
(БЭСМ, СМ). Поэтому основные усилия инженеров по информации были сосредоточены на
поиске и информировании своих специалистов о новейших достижениях и передовом опыте
курируемой предметной области. К числу лидеров, работающих по отдельным направлениям
на уровне центров анализа информации, следует отнести: ВНТИЦентр, ВИНИТИ, ИНИОН,
ВИМИ,
БелНИИНТИ,
УкрНИИНТИ,
отдельные
торгово-промышленные
палаты
и
территориальные ЦНТИ. Даже в низовых ОНТИ, при наличии энергичных и компетентных
специалистов, создавались группы информационного анализа, осуществлялись сложнейшие
прогнозно-аналитические исследования.
Среди центров анализа информации различали три основных типа:
1. Научно-отраслевые ЦАИ. Они занимались исчерпывающим сбором появляющейся в
мире научной информации по отрасли знания, включая социальные науки. Одновременно эта
информация анализировалась, обобщалась, синтезировалась для получения нового знания. В
СССР к таким центрам отнесены: Центр по ядерным данным при Физико-энергетическом институте в Обнинске, Научно-информационный центр по молекулярной спектроскопии
Сибирского отделения АН СССР.
2. Проблемные центры анализа информации, максимально полно концентрирующие
информацию, необходимую для решения определенной совокупности проблем. Например,
Центр технической информации по загрязнению атмосферы в США, Центр данных о
свойствах рабочих тел для умеренных температур в Советском Союзе.
3. Масштабные исследовательские центры анализа информации с большим штатом ученых
и специалистов, которые занимались сбором и анализом данных измерений и наблюдений
«сырой», лишь частично обработанной информации о больших системах (Национальный
метеорологический центр, Национальный центр океанографических данных в США). Они
заняты поиском глобальных закономерностей, имеют разветвленную сеть точек сбора данных,
большой штат сотрудников. Например, в советский период времени Всесоюзный
24
геологический
институт
(ВСЕГЕИ)
собрал
и
обработал
богатейшие
массивы
картографической, геохимической, геофизической информации, минеральные коллекции,
одним из первых ввел в рабочий режим «АСНТИ-Геология».
8. Основные направления обзорно-аналитической деятельности.
В конце 1980-х гг. был предложен перечень задач для подразделений информационного
анализа
в
научно-исследовательских
учреждениях
и
конструкторских
бюро
машиностроительных и приборостроительных отраслей. Обширный перечень раскрывает
типовые направления обзорно-аналитической деятельности, а также показывает ее
перспективные задачи.
1. Анализ и прогноз развития предметной области. В рамках этого направления
выявляются тенденции развития отраслей и тематических направлений, «траектории»
развития
тематики
НИР
и
ОКР.
Как
правило,
осуществляется
распознавание
«хроноструктуры» развития предметной области. Объектом анализа наиболее часто
выступали отдельные тематические направления, реже анализировались их научные и
хозяйственные связи. Центральными отраслевыми органами НТИ ежегодно осуществлялось
выделение эффективных НИОКР и нововведений. Это направление предполагает также
измерение факторов, влияющих на развитие предметной области, функциональный и даже
функционально-стоимостной анализ разработок. Обязательными полагаются выявление
зарубежных изделий-конкурентов, прогнозная оценка их конкурентоспособности, выбор
перспективной номенклатуры для предприятий.
2. Сравнительный анализ разработок изделий. Для данного направления выделено более
20 базовых задач разного уровня общности. Задачи первого и второго направлений частично
перекрываются по аспектам анализа, но они относятся именно к сравнению объектованалогов.
3. Анализ научно-технического потенциала учреждений. Это направление активно
разрабатывалось, начиная с 1960-х гг. (труды школы Г. М. Доброва, А. А. Коренного, работы
В. В. Налимова, Б. С. Елепова, В. М. Чистякова, Ю. Н. Кислякова и др.). Были выявлены
индикаторы оценки научно-технического потенциала, источники информации, методы
обработки данных, а в 1987 г. была апробирована в ВИМИ целостная технология
автоматизированного информационного анализа.
В рамках этого направления осуществлялись: анализ и оценка патентно-лицензионной
деятельности коллективов, кадровой структуры, творческой продуктивности, динамики
освоения их разработок и невнедренных предложений, научно-исследовательской и
экспериментальной базы, потенциала коллективов в целом.
25
ОНТИ предприятий всегда осуществляли непрерывное наблюдение за публикациями,
патентованием изобретений, отчетами НИОКР профильных научных и производственных
коллективов. В настоящее время это направление не исчезло из информационной практики, а
выступает под более общим наименованием - оценка интеллектуального капитала
предприятий (или оценка нематериальных активов).
В целом, каждое информационное учреждение страны в анализируемый период
накапливало опыт обзорно-аналитической деятельности определенного уровня.
9.Методические материалы 1960-1980-х гг.
Благодаря широкой обзорно-аналитической практике, вмененной в этот период в задачи
органам НТИ, первые методические обобщения вышли в свет в 1968 г.
Процесс формирования методических основ осуществлялся в следующих направлениях:
типизация обзорно-аналитических материалов в обобщающих монографиях А. И.
Михайлова, А. И. Черного и Р. С. Гиляревского (1968, 1976 гг.), Д. И. Блюменау (1982 г.);
разработка органами НТИ методических инструкций для внутреннего пользования с
изданием единичных из них (Р. В. Вальдман (1978 г.), методические материалы УкрНИИНТИ,
БелНИИНТИ и др.);
обобщение типовых методических требований («Подготовка обзоров органами научно-
технической информации» 1974 г.);
разработка учебных программ, учебных курсов по специализации «Информационный
анализ и синтез» в ИПКИР, выход в свет учебных пособий преподавателей ИПКИР (Б. И.
Янюк, А. Г. Васильев, В. К. Грецов);
стандартизация требований к отдельным формам прогнозно-аналитических материалов
(ГОСТ 7.38-82. Доклады о наиболее важных отечественных и зарубежных достижениях в
области науки, техники и производства; типовые требования к патентным исследованиям с
действующим сейчас ГОСТом Р15.011-96);
статьи, книги, диссертации, отчеты НИР и ОКР, развивающие авторские методики
(пробельный анализ, сленговый анализ, оценка научно-технического потенциала и др.);
предлагаемые и реализованные варианты автоматизации отдельных процессов
информационно-аналитической
деятельности,
которые
алгоритмизируют
некоторые
процедуры анализа, позволяют получать аналитикам воспроизводимые результаты.
Уровень методического знания существенно различался для разных центров подготовки
обзорных материалов. В частности, серьезный разрыв отмечался для методических разработок
органов НТИ закрытых учреждений оборонной отрасли, электротехники, электронной
промышленности и методических рекомендаций для подготовки обзорных документов,
26
предназначенных для широкого круга читателей.
Библиографы,
которые
одними
из
первых
шагнули
к
количественным
(библиометрическим) исследованиям документального потока и научному осмыслению
методов свертывания, так и не смогли преодолеть барьер от библиографических обзоров к
аналитическим.
Длительно
дискутируя
о
правомерности
«критической»,
научной
библиографии, библиографы и книговеды давали лишь самые общие схемы подготовки
обзоров. Предлагалось даже вернуться к старому термину «обозрение», качество подготовки
которых всегда зависело от индивидуального таланта обозревателей, а не разработанной
методики. Тем не менее, библиографы остаются активными участниками аналитической
работы, предоставляя собственный продукт — научно-вспомогательные библиографические
указатели, схемы систематизации литературы по проблеме, авторские и предметные ключи,
источники разыскания публикаций, а также инициативно подготовленные обзоры.
В развитии методик принимали участие разные типы организаций. Например, в Библиотеке
иностранной литературы (ВГБИЛ) и в библиотеке Ленинградского НИИ военной медицины
впервые в стране стали осуществляться исследования в области автоматизации процесса
анализа потока цитированной литературы (М. Левин, Н. В. Колпакова). Крупные библиотеки, головные информационные центры страны получали государственные заказы на обзоры
отечественных и зарубежных публикаций по проблемам, при реализации целевых программ.
Объем обзорно-аналитической продукции постепенно наращивался и в работе низовых
информационных служб.
Ведущие специалисты этих лет в области информационного анализа и синтеза в стране
отчетливо осознавали ограниченные возможности ведения прогнозно-аналитических
исследований госбюджетными учреждениями в рамках существующего для них технического
обеспечения и штатного расписания, но уже назревал переход к систематической прогнозноаналитической работе служб информации разного уровня и подчинения. В конце 1980-х гг.
стали решительно вноситься предложения о существенном пересмотре задач служб НТИ,
выделении аналитических подразделений, новых аналитических продуктах, приоритетных
темах.
Впервые в этот период были введены термины «информационная диагностика» (В. Р.
Серов, 1989 г.) и «информационный мониторинг» (Г. Ф. Горду-калова, 1990 г.).
Они обозначали такое направление в развитии информационной аналитики, которое
требует жестких алгоритмизированных схем, персональной ответственности аналитика и
активного использования вычислительной техники.
Была описана реализация алгоритма для информационного мониторинга на средних
вычислительных машинах в ЛенЦНТИ в учебном пособии ИПКИР.
27
В зарубежной литературе сейчас также активно обсуждаются проблемы технологии
информационного мониторинга в рамках профессии аналитика. Это яркое свидетельство
востребованности мониторинговой технологии, готовности специалистов к глубокой
диагностике объектов разной природы на основе анализа и синтеза информации о них.
10.Разработка автоматизированных систем анализа информации.
К
началу
1970-х
гг.
были
заложены
исходные
составляющие
для
создания
автоматизированных систем анализа информации:
теоретические основы - «безбумажной информатики» (работы В. М. Глушкова, А. И.
Михайлова, А. И. Черного, Р. С. Гиляревского, Г. М. Доброва и др.);
технологические и программно-лингвистические аспекты анализа информации (А.
А. Стогний, Н. Г. Зайцев, А. В. Соколов и др.).
В эти годы был сделан вывод о сохранении процесса распознавания смыслов за человеком.
В теоретически значимой обобщающей работе ведущие специалисты Г. Э. Влэдуц, В. А.
Успенский, Ю. А. Шрейдер писали: «Период поисков философского камня в семантической
алхимии закончен. Обойти проблемы на чисто технологическом уровне не удалось. Настало
время планомерного применения в информатике глубоких семантических методов».
Проводятся исследования в области «экспериментальной семантики» — автоматизированного
распознавания научных текстов, а в настоящее время — это широко известная область
компьютерной лингвистики.
Были разработаны программы для стандартной обработки словесно-числовой информации
для ЭВМ. Создавались первые экспериментальные варианты аналитических информационных
систем. В частности, в Институте кибернетики АН УССР разрабатывался комплекс
информационных систем типа автоматизированных систем анализа научной информации
(АСАНИ). Основными задачами таких документально-фактографических систем являлись:
• проведение библиографического поиска документов по большому числу поисковых
признаков;
• осуществление анализа информационного массива в выбранной области, включая
выявление информационных и семантических связей между документами, изучение
тенденций развития заданной области науки и техники, выявление перспективных проблем,
методов, алгоритмов и др.
Возможности АСАНИ были достаточно современны: учитывались ссылки, строилось
дерево связей между документами, т. е. системы этого типа были ориентированы не только на
многоаспектный поиск информации, но и на некоторые варианты автоматического анализа —
28
изучались темпы старения, степень рассеяния информации для узких тематических направлений.
Главное — уже в эти годы прямо ставилась проблема обработки информации для
выявления тенденций и прогнозирования объектов. Несмотря на малую оперативную память
и низкую (с современных позиций) скорость обработки данных в больших ЭВМ, Л. С.
Козачков уже тогда предлагал и частично реализовал со своими коллегами вторую систему —
АСАПИ (автоматизированную систему анализа прогнозной информации). Основным
достижением этого проекта являются принципы, положенные в основу информационного
прогнозирования. Он предусматривал в качестве обязательного этап информационного
моделирования,
работу
экспертов,
качественный
анализ
опубликованных
мнений
специалистов и информационно-логический анализ альтернативных решений проблемы.
Конечно, эффективность систем анализа того времени снижалась из-за нерешенных
проблем распознавания образов на этапах обработки документов и последующего
формализованного представления его информационных системах; из-за многоязычного
представления информации
об
объектах в документальном потоке) и
глубокого
индексирования текстов и т. д. За рубежом были и решались примерно те же проблемы.
Экспериментальный режим работы таких систем объяснялся многими факторами.
Сложность программирования, включая постановку задачи (информационные работники и
программисты говорили «на разных языках»), длительный процесс проверки и доработки
программ, их объединения в многозадачный комплекс. Трудоемкая предшествующая
обработка текстов требовала не только аспектного реферирования, но и ручной расстановки
связей и отношений между ключевыми словами. Для каждого тематического массива
создавались дескрипторные словари или классификационные схемы, словари отношений,
указателей роли, синонимов и др. При прогнозировании предметных областей остро стояла
проблема «консервативности» систем классификационного типа для отражения реальных
изменений в потоке информации. Эргодические свойства естественных языков приводили к
широкому кругу проявлений информационной неопределенности. В основе тех и
современных систем остается главный принцип действия: чем больше общих признаков у
документа и запроса, тем надежнее распознается документ. Не решена проблема
распознавания графических материалов и образов. Не удавалось добиться существенного
улучшения алгоритма распознавания в рамках элементарной теории множеств и частоты
встречаемости признаков.
Анализ информационного массива реализовывался по следующему алгоритму:
1. формирование непересекающихся групп документов по различным критериям
смыслового соответствия. Например, по фамилиям, языку, виду и наименованию источника
29
информации, стране, типу и объекту исследования или их сочетания.
2. Построение различных распределений, описывающих частоту отдельного признака, а
также связей между элементами массива. Например, массив упорядочивался по числу ссылок
на работы автора в рамках заданного объекта исследования.
3. Производился анализ частоты вхождения фиксированного признака по заданным в
поисковом предписании ограничениям. При этом условия анализа были достаточно
сложными. Например, поисковое предписание предполагало анализ массива тех документов,
которые рассматривают одновременно 2 группы методов, ссылаются на одного автора, были
опубликованы в стране в последние 5 лет, с конкретной сферой приложения результатов.
4. Осуществлялось построение «генеалогических деревьев», которые упорядочивали
документы по какому-либо вопросу. (В настоящее время их называют кластерами, фреймами.)
В качестве исходной избиралась конкретная публикация. Например, строилось дерево связей
публикации «А» с указанием ссылок исходной работы, ссылок на выявленные ссылки (ссылки
цитируемых источников), ссылок предшествующих им источников. В поисковое предписание
могли вноситься ограничения по признакам страны, языка, вида публикаций.
5. Построение «генеалогических деревьев» по проблемам (семантическим связям), когда в
вершинах графа представлялся объект анализа, например, метод исследования.
Таким образом, к началу 1990-х гг. концептуально был подготовлен переход от
библиографических и аналитических обзоров к информационной диагностике объекта,
технологиям
информационного
мониторинга.
Оставались
нерешенными
многие
технологические и кадровые задачи.
Понятие информационно-аналитической технологии
Литература:
Гордукалова, Г.Ф. Информационно-аналитические технологии // Анализ информации:
технологии, методы, организация: учеб.-практ. пособие. – СПб. : Профессия, 2009. – С. 158165.
Аналитические технологии строятся на использовании различных методов, методик,
приемов, процедур, процессов, многие из которых практически используются несколько
тысячелетий.
Следует различать общенаучные понятия «метод» и «методика». Метод — лишь путь
исследования, «образ действий», а методика — рекомендации для использования методов.
30
Метод — особый путь, средство или способ познания, достижения цели, решения
отдельной задачи.
Методика — это совокупность специальных действий для изучения объекта,
позволяющих целенаправленно получать воспроизводимые данные об объекте.
Совокупность действий в методике может быть достаточно жестко определена в
последовательности их применения, алгоритмизирована: а1 > а2 > аЗ и т. д., когда второе
действие не может быть осуществлено без завершения первого, например:
осуществить отбор количественных показателей из текстов > привести их в
стандартизированную систему измерения > выделить максимальные и минимальные значения
показателей за учетный период времени.
В других случаях предусматривается лишь перечень действий, которые могут
осуществляться параллельно или последовательно, например:
произвести сетевой поиск, отбор, библиографическое описание и аннотирование публикаций
по теме.
Современное представление об интеллектуальных технологиях. Длительный период
времени в библиотечной деятельности использовались понятия «техника библиотечных
процессов», позже в употребление вошло понятие «методика». Благодаря использованию
технических средств, сейчас чаще используется термин «технология» – совокупность
процессов, операций, приемов и правил, последовательное использование которых позволяет
получать намеченный и воспроизводимый результат.
Типовой процесс формирования интеллектуальных технологий очень схож с основными
этапами формирования методики обзорно-аналитической деятельности:
«аристотелевский» этап общенаучного анализа;
длительный
период
библиографирования,
реферативного
обозрения
и
интеллектуального синтеза;
количественные (библиометрические) исследования потоков документов и текстов;
современный этап, сочетающий содержательные технологии информационной
диагностики и формально-логической машинной обработки данных — время разработки
интеллектуальных систем, построенных на знаниях.
Этот процесс протяжен во времени как постепенное скопление приемов, разработка
31
частных методик, их обобщение, спецификация и объединение методик в технологическую
схему, автоматизация нормализованных процедур.
Развитие информационной аналитики в технологическом аспекте направлено от
выработки отдельных приемов анализа информации к целостным методикам прикладного
характера,
а
от
них
—
к
алгоритмизированным
технологиям
и
описанию
интеллектуальных процедур анализа сведений об объекте для получения выводного знания
о нем с последующей автоматизацией наиболее формализованных приемов анализа.
Исторические корни аналитических технологий, их современное наполнение:
1. В технологии обзорно-аналитической деятельности включены библиотечные,
библиографические и информационно-аналитические методики поиска и анализа данных
об объекте.
2. Интерпретация и оценочное синтезирование данных об объекте производятся на
семантическом уровне текста, его фрагментов или данных из них. Описание, а также
воспроизводимая реализация их достаточно сложны, так как они слабо формализуются, а
также имеют разное наполнение в зависимости от особенностей анализируемого объекта.
3. В отечественной науке под технологией издавна понималась совокупность
упорядоченных процессов и операций (приемов, процедур), направленных на получение
какого-либо результата. В зарубежной практике было распространено обратное их
соотношение: технология — прежде всего технические устройства, а техника — это
методические рекомендации по их применению. Сегодня эти представления сближаются,
поскольку почти во все процессы органично вписаны какие-либо технические устройства –
производящие, фиксирующие или обрабатывающие что-либо.
4. Одновременно
уходит
определение
понятия
«технология»
как
строго
алгоритмизированной последовательности действий, приводящей к получению продукта с
заданными
свойствами.
Появился
весьма
неопределенный
термин
«социальные
технологии», под которыми можно понимать как четко фиксируемые и проработанные
технологические процессы (например, процедуры голосования, обработки результатов, «25
кадра»), так и «размытые» интеллектуальные технологии наставничества, разнородные
технологии избирательных кампаний и многие другие, которые могут приводить к прямо
противоположным результатам. Таким образом, сложность современного представления о
технологиях состоит в том, что в них вписаны не только строго формализованные действия,
но и интеллектуальные процессы, методы качественного анализа данных, разнообразные
процедуры и приемы.
Среди схем, предназначенных для интеллектуальных технологий, как правило,
выделяются
отдельные
этапы.
Например,
в
политологических
исследованиях
32
характеризуются шесть последовательных, связанных друг с другом этапов:
1. формулирование гипотезы;
2. операционализация гипотезы (теории);
3. выбор адекватных методов исследования;
4. проведение исследования;
5. анализ данных;
6. интерпретация результатов.
Если окинуть взглядом другие схемы, предложенные для описания информационноаналитической деятельности, то чаще всего мы видим все те же процессы, характерные для
любой социальной деятельности: сбор информации об объекте, ее анализ и синтез. При более
детальном их рассмотрении нередко нарушается граница между информационными и
общенаучными средствами анализа.
Самый используемый сейчас термин в мире — «информационные технологии». Он
воспринимается либо очень широко — как любые процессы работы с информацией, либо
весьма узко — как совокупность программного, технического обеспечения работы с
машиночитаемой информацией.
Изберем наиболее широкий подход и условимся понимать под информационноаналитической
технологией
алгоритмизированные,
(ИАТ)
технологические
целенаправленные,
цепочки
в
значительной
интеллектуальных
мере
процессов
аналитико-синтетической переработки информации с предсказуемым (планируемым)
продуктом-результатом и с возможным использованием компьютерной техники,
средств связи.
В составе ИАТ выделяют два больших класса:
1. Неинструментальные (интеллектуальные) технологии — извлечения, запоминания,
сопоставления информации в процессе мыслительной деятельности.
2. Инструментальные
технологии
—
переноса
данных,
их
поиска,
хранения,
преобразования и т. д.
Для описания ИАТ информационные работники используют этапы, пошаговые
алгоритмы, объединение отдельных процессов в функциональные модули и циклы.
Первичные технологические схемы информационной аналитики
Последовательность и набор процедур зависят от целей, специфики объекта и условий
информационного анализа. Вне этой зависимости можно предложить лишь некоторый перечень
общих процессов, операций и приемов, которые имеют различный уровень формализации,
временной протяженности. Они связаны целевыми процессами (задачами), которые наиболее
часто реализуются аналитиком.
33
Процессы
Приемы, процедуры
Результаты
Поиск аналогий
Фиксация, сортировка и сравнение
Найденный аналог
признаков
Сравнение
аналогов
Сравнение
индикаторов
Формирование шкал:
различий
согласия
противоречий
равенства
с
периодом
контрольными
уровня
развития
объектов-аналогов
Сопоставление
вующим
Оценка
предшествремени,
показателями,
Выявление критических зна-
с чений,
тенденций
развития
с объекта
базовым объектом
Вычисление
средних
размаха
величин.
значений
и
Аппроксимация
данных
Диагностика
смыслов
Фрагментация
текста.
Сверты-
Понятийное
ядро
значений,
вание, развертывание высказываний, компоненты смыслов (номинаанализ объема понятий, поаспектный, тивные,
пробельный, ассоциативный анализ
внешнеситуационные,
фактические,
диктальные,
когнитивные,
предметно-реля-
ционные и др.)
Поиск
причинной связи
Построение поисковой гипотезы,
ее проверка
Ранжированный список причин
Ризома «причина-следствие»
Логико-семантические операции,
казуальный анализ
Перенесение
свойств
Минимизация
индикаторов
Импликация, метод остатков и
Перспективный образец
различий
Приемы склеивания, поглощения,
обобщения,
Рейтинг объектов по значимо-
конструирования му (или комплексному) инди-
индикаторов
катору
Отбор значимых индикаторов
Трансформация
данных
Экстрагирование данных
Свертывание, обобщение
Выявленные изменения, тенденции
Классификация
34
Визуализация
Исчисление
Шкалирование
данных
Построение
Визуализация
хронолингвистических,
хронособытийных
и
тенденций,
оценки темпов развития объекта,
иных
(номинативные,
шкал выявленные особенности объекта
порядковые,
интервальные, шкалы отношений)
Отражение
Сопоставительные
изменений объекта типизация
таблицы,
изменений,
их
Источник и причины измене-
ви- ний, тенденции
зуализация
Отсечение
Сравнение с показателем размаха
Наличие, источник и причины
аномальных
значений для выборки, со средними аномальных
значений
значениями,
с
значений
индика-
предшествующим торов
периодом
Интерпретация
изменений
Оценка
Поиск
аналогов,
выявление
Перечень причин, следствий
причин, возможных следствий
Дерево целей, решений, проблем;
Шкала оценок, конечная оценка
состояния объекта, ситуационный анализ, региональный
темпов развития
анализ,
анализ
кривых
роста
индикаторов
Сегментация
однородных
объектов
Шкалирование признаков, матрица
факторных нагрузок,
Характеристика сегментов, выбор лидеров и аутсайдеров
Классификация и кластеризация
данных и др.
Суждение,
построение
Правила
построения
умоза-
ключений
Перечень оценочных суждений. Синтезирование данных об
объекте
Оценка
Исчисление,
возможности
лирование условий
Диагностика
объекта
Шкалирование
сравнение,
шка-
Оценка степени возможности,
необходимости, достаточности
диагнозов,
Формулировка
основной
принятие диагностического решения тенденции, оценки состояния объекта в анализируемый период
времени
Синтезирование
Органичное
комплексирование
Текст
обзорного
документа
35
данных
данных. Проверка выводного знания приложения
на противоречивость, достаточность,
надежность
Прогнозиро
вание объекта
Сравнение имеющихся прогнозов,
Краткосрочный
аппроксимация кривых, ресурсный рекомендации,
подход,
дерево
проблем,
целей,
сценариев
формирование
прогноз,
зависимый
решений, прогноз, перспективный образец
развития, объекта
перспективного
образца объекта и др.
Выводное
знание,
Сравнение
суждений
с
предшествующим знанием
Тенденции, круг новых объектов или новых характеристик
построение
базового объекта, новых сфер
применения и др.
Выводы
Классификация
выводов,
соот-
Рекомендации заказчику
несение с целями заказчика
Используя информационно-аналитические технологии, не следует забывать о трех
ограничительных и обязательных условиях:
1. Информационный анализ осуществляет аналитик, а не специалист конкретной
области знания.
2. Информационный анализ должен быть направлен на получение выводного знания об
объекте на основе уже известных сведений о нем.
3. Технологическая схема информационно-аналитической деятельности может быть
линейной (строго последовательной) лишь условно, поскольку практические задачи и
условия их реализации разнообразны.
Выбор технологического пути зависит от главных факторов:
специфики объекта и его локализации;
задач его информационного анализа;
условий реализации анализа.
Таким
образом,
для
общей
технологической
характеристики
важно
понимать
информационный анализ как совокупность процессов целенаправленного свертывания
известной информации об объекте, специальных методов, процедур ее анализа и синтеза
для получения выводного знания.
36
Типовые этапы создания информационно-аналитической продукции: поиск, переработка,
интерпретация и синтезирование (комплексирование) информации об объекте.
Для обеспечения репрезентативного массива исходных документов/данных об объекте,
оперативности и снижения трудоемкости аналитических процессов, аналитик должен
стремиться максимально полно автоматизировать не только вспомогательные, но и основные
процессы работы.
Результаты анализа могут быть представлены в форме итогового выводного знания
(выводов и рекомендаций), а также в виде результатов отдельных этапов классификаторов,
частотных словарей, дайджестов, таблиц и иных форм синтезирования данных. В
автоматизированных
информационно-аналитических
системах
основная
форма
представления – формализованные отчеты. Выбор форм представления результатов зависит
от цели анализа, требований заказчика, используемой технологии. Обязательной является
оценка соответствия результатов исходной задаче анализа.
Виды информационно-аналитических технологий
Базовые информационно-аналитические технологии:
информационное моделирование,
информационная диагностика,
информационное прогнозирование объекта.
Эти технологии могут выступать как этапы выполнения заказа на масштабное аналитическое
исследование, так и в качестве самостоятельных технологий. В настоящее время важно
научиться переходить от информационной модели объекта к его информационной диагностике
и прогнозу.
Каждая из названных технологий может использоваться как самостоятельная с
собственными конечными результатами при условии включения в нее вышестоящих
технологий. Так, прогнозирование объекта потребует от аналитика предварительного
информационного моделирования и диагностики его современного состояния. Они могут
реализовываться в общей технологической схеме или поэтапно. Качество обзорноаналитической
продукции
в
значительной
степени
обеспечивается
качеством
информационной модели, что требует тщательного освоения этапов ее создания.
Специализированные технологии:
информационное оппонирование,
информационная экспертиза объекта,
информационная диагностика рисков проекта,
бенчмаркинг,
региональный анализ,
37
технологии управления знаниями,
логистика информационных ресурсов.
К специальным информационно-аналитическим технологиям отнесены методические
комплексы, которые предназначены для решения узкоспециальных аналитических задач и
отличаются от типовых схем диагностики хотя бы одним значимым компонентом.
Специализированные технологии имеют разную историю возникновения. Многие из них
представляют целостные направления в аналитике, а иные лишь складываются под решение
новых задач.
Методы информационно-аналитической деятельности
План лекции:
1. Проблема классификации методов
2. Типизация методов информационной аналитики
3. Общенаучные, отраслевые и межотраслевые методы
4. Специальные и узкоспециальные методы
5. Терминологический анализ
6. Категориальный анализ
7. Сленговый анализ
8. Пробельный анализ
9. Контент-анализ
10. Интент-анализ
11. Казуальный анализ
12. Метод предпочтений
13. Рейтинговый анализ
14. Дискурсивный анализ
15. Смысловой анализ текстов
16. Методы количественной обработки и представления данных
Литература:
Гордукалова, Г.Ф. Методы информационно-аналитической деятельности // Анализ
информации: технологии, методы, организация: учеб.-практ. пособие. – СПб. : Профессия,
2009. – С. 228-276.
1. Проблема классификации методов
38
В методологии научного познания выделялись количественные и качественные методы,
методы эмпирического и теоретического освоения действительности. XX век — время
экстенсивного становления методологии научного исследования. В 1920-1930-е гг. активно
развивались исторические, статистические, лингвистические, социологические, а позже
психологические методы, приемы, тестовые методики. Разрабатывались и экспериментально
проверялись новые методические подходы к поиску, индексированию, реферированию
документов. В середине столетия в научные исследования вошла вычислительная техника,
позволяющая обрабатывать большие массивы данных, строить имитационные динамические
модели объекта. Оказались востребованными общенаучные подходы к анализу сложных
явлений — системный, системно-структурный, структурно-деятельностный анализ. Главное
в них — полное рассмотрение внутренних и внешних связей анализируемого объекта,
сочетание используемых средств познания. Активно обогащались количественные методы.
Собственные метрические направления появились во многих отраслях знания — биометрия,
эконометрия, технометрия и т. д. Понятие «метод» стало широко употребляться в прикладном
значении — любая алгоритмизированная схема анализа могла называться методом
исследования или практической деятельности. В 1970-1990-е гг. появилась возможность
вести личные базы данных, объединять и сканировать для обработки грандиозные по объему
массивы, легко использовать прикладные программы статистической обработки данных.
Геоинформационные и гипертекстовые технологии дали толчок для анализа нечетких
множеств, слабо формализованных объектов. Сейчас практически во всех областях науки
ведутся разработки интеллектуальных систем, построенных на знаниях, соединяющих в один
технологический комплекс методические достижения многих отраслей знания. Проблема
классификации методов становится все более неразрешимой. Среди основных причин
следует назвать:
многозадачность отдельных методов;
взаимопроникновение — «смешение» количественных и качественных методов, когда
стираются очевидные границы между ними;
расширительное толкование понятия «метод»: им стали обозначаться частные приемы,
любая программа, стандартизирующая обработку данных;
появление комплексных технологий, сочетающих разные методы.
Значимое влияние оказывают субъективные факторы: различное понимание и нестрогое
использование методов отдельными исследователями, а также «повторное» открытие многих
специальных
методов
(методик,
приемов),
которые
обозначаются
под
разными
наименованиями и даже фамилиями далеко не первых их разработчиков. В этой связи трудно
представить логически выстроенную классификацию общенаучных и специальных методов
39
анализа информации.
2. Типизация методов информационной аналитики
Типизировать методы современной информационной аналитики можно по разным
признакам: по виду анализируемой информации, форме свертывания сведений об объекте,
цели и этапам анализа информации.
Каждая группа методов включает достаточно широкий круг самостоятельных методик и
технологий.
Таблица. Типизация методов информационной аналитики
Признак типизации методов
Группы методов
Анализируемая информация об методы анализа суждений
объекте
методы анализа выявленных количественных данных об
объекте
методы анализа текстов
методы анализа документов
методы анализа потока информации об объекте
По
форме
свертывания библиографические методы
сведений
библиометрические методы
формально-логические методы
классификационные
концептографические (смысловое свертывание)
статистические
Характер анализа информации
формально-логические
логические (или логико-лингвистические)
семантические (содержательные, ассоциативные)
прагматические (концептографические, оценочные)
количественные (статистические)
графические
комплексные методики и технологии
Цели базовых технологий
методы информационного моделирования объекта
методы информационного анализа и диагностики
объекта
методы информационного прогнозирования
методы специальных аналитических технологий
40
анализа-синтеза методы поиска и отбора документов/данных
Этап
информационно-аналитической
деятельности
(в
логике
методы классификации
их методы лингвистического и семантического анализа
типичного использования в ИАД) и свертывания
методы статистической обработки данных
методы синтеза и интерпретации данных
методы текстового, графического и иного представления
выводного знания
3. Общенаучные, отраслевые и межотраслевые методы
Общенаучные методы исследования формировались более трех тысячелетий. К настоящему
времени среди них в числе основных для анализа документальной информации могут быть
названы: системный анализ (системно-структурный), классификационные, количественные
методы.
Наибольшее влияние на технологии информационного анализа оказали методы
лингвистики, математической статистики, литературоведческого анализа текстов. В 19601980-е гг. разрабатывались многочисленные методические инструменты формального
анализа языка: метод структурного и математического анализа, дескриптивная и генеративная
лингвистика, модель описания языка «от смысла к тексту», дистрибутивный и компонентный
методы анализа, функциональная грамматика, прагматический метод и др. Они нашли
активное применение в компьютерной лингвистике.
Опыт литературоведческого анализа текстов первоначально был воспринят в методике
аннотирования и реферирования текстов, а позднее через работы в области семиотики
обогатил информационные методики качественного анализа текстов. Для анализа данных о
хозяйствующих субъектах заимствуются приемы экономических и маркетинговых методик.
Из математической статистики для информационного анализа востребованы методы
ранговой статистики, корреляционного, факторного и кластерного анализа.
4. Специальные и узкоспециальные методы информационной аналитики
Специальные
методы
формировались
по
мере
развития
библиотечно-
библиографической и информационной деятельности – методы библиографического поиска,
отбора документов, методы свертывания сведений о документах библиографического
описания документов, аннотирования, реферирования, классификации и индексирования
документов и данных, методы библиометрии.
Существует самостоятельная классификация методов библиографирования, выделяющая
41
2 группы – аналитические и синтетические методы. К аналитическим методам относятся:
1.Общий библиографический анализ документа, осуществляемый в целях выяснения его
тематики, формальных и содержательных особенностей, достоинств и недостатков, целевого
и читательского назначения.
2.Библиографическое описание документа.
3.Аннотирование и реферирование.
4.Индексирование и предметизация, т. е. выражение содержания документа с помощью
предметных рубрик или условных знаков какой-либо классификации.
Результат последних трех процессов в совокупности объединяется в библиографическую
запись, составление которой образует переход от аналитических методов к синтетическим
методам библиографирования:
1. Выявление документов по тем или иным признакам.
2. Отбор документов по заранее заданным критериям.
3. Группировка библиографических записей в библиографическом пособии.
Условность выделения аналитических и синтетических методов библиографирования
состоит в том, что в действительности процессы библиографического анализа и синтеза
взаимосвязаны и в реальном процессе библиографирования осуществляются в значительной
мере одновременно.
Узкоспециальные методы (функционально-стоимостный анализ, технический анализ
биржевых котировок, метод японских свечек и др.) используются по мере необходимости для
отдельных массивов информации.
Аналитик в каждом случае может выстраивать необходимую технологическую цепочку
методов, включая в нее отдельные приемы и конкретные методы. Практически же
преимущественно
комплексные
эксплуатируется
методики,
экспертное
сочетающие
в
себе
знание
специалистов.
некоторые
Используются
логико-лингвистические,
семантические и прагматические приемы анализа текстовых фрагментов.
5. Терминологический анализ
Терминологический анализ (ТА) — общенаучный подход к определению группы
взаимосвязанных ключевых слов для установления истории терминов, их содержания,
выявления иноязычных синонимов, изменения объема понятия с течением времени.
Формируется и используется с момента появления первых словарей и грамматических правил.
Имеет широкое распространение при составлении словарей, справочников, рубрикаторов,
терминологических стандартов, в библиотеке — при формулировке предметной рубрики,
42
выполнении фактографических запросов словарного типа. В научных исследованиях является
обязательным: практически любая обобщающая работа начинается с определения и
сопоставления базовых терминов.
В информационно-аналитической деятельности терминологический анализ позволяет
аналитику выполнить следующие задачи.
на первом этапе анализа предметного поля объекта освоить соподчинение конкретных
КС, выделить однородный круг понятий и принятых для их обозначения терминов, уточнить
наполнение незнакомых ключевых слов;
отобрать иноязычные синонимы, необходимые для поиска профильных документов;
исключить устаревшие понятия из предметного поля, выявить их современное
обозначение.
Для этого используются энциклопедии, толковые словари, терминологические стандарты,
словари синонимов. В сложных случаях анализа новых терминов может выявляться
этимология — происхождение слова и его первоначальное значение, которое затем
сопоставляется с авторскими определениями.
6. Категориальный анализ
Современный категориальный анализ (КА) — разновидность терминологического.
Предполагает установление круга категорий в предметном поле объекта — базовых КС,
характеризующих
структурные
составляющие
предметного
поля.
Разрабатываются
ограничения, позволяющие выдерживать определенный уровень детализации «стержневых»
категорий. Как правило, определяется локальный перечень категорий
— 5-7-10,
характеризующих объект в значимых аспектах.
Категориальный анализ может проводиться с помощью сравнения уже созданных
классификационных схем, с помощью формально-логического сравнения объема понятий, на
основе сравнения определений понятий.
7. Сленговый анализ
Сленговый анализ (СА) — особая разновидность терминологического. Впервые описан С.
Д. Хайтуном в 1983 г., который характеризует его как самостоятельный метод выявления
новых терминов, устойчиво используемых в локализованных научных сообществах. Это
актуальная аналитическая задача, которая частично решается при выявлении перспективных
тенденций в развитии научных, технологических направлений и даже в процессе поиска
инновационных решений для практических сфер деятельности.
Особенностью сленгового анализа является фиксация КС единичной продуктивности,
43
отсутствующих в отраслевых терминологических словарях, профильных текстах последнего
года издания.
8. Пробельный анализ
Предложен к использованию в 1983 г. известным отечественным специалистом в области
информатики, аналитиком Э.С. Бернштейном. Его основное назначение — целенаправленный
поиск пробелов в знании об объекте. В отличие от СА, требует весьма серьезного
аналитического опыта от исполнителей, а главное — учета семантических связей между
документами, авторами текстов, отдельными КС, концепциями, смыслами суждений об
объекте.
Пробельный анализ (ПА) осуществляется на основе сравнения известного знания об
объекте с перспективным образцом объекта. Результат — выявленный круг пробелов в
знании, которые необходимо восполнить для дальнейшего развития объекта.
Реализация ПА может строиться и на ином принципе — выявлении отрицательных
потребительских свойств объекта.
Многофакторный анализ предполагает творческий подход к выбору текстовых
фрагментов, очередности «послойного» анализа предметного поля и его внешних связей
(известные технологии — новые разработки, авторы-оппоненты и др.), аспектных срезов их
анализа.
9. Контент-анализ
Понятием «контент-анализ» дословно может обозначаться любой содержательный анализ
информации с учетом контекстных связей. Контекст (от лат. contextus — соединение, тесная
связь) определяется как относительно законченный отрывок письменного или устного текста,
в пределах которого наиболее точно выявляется значение входящих в него слов, выражений.
Наличие в текстах повторяющихся КС (тем, образов, ссылок на проблемы, оценок,
утверждений, аргументов, формальных конструкций, конкретных имен) раскрывает
отношение к ним в конкретный исторический период времени, динамику в развитии знания
об объекте, точки рождения нового знания о нем. Контент-анализ позволяет отбирать
наиболее значимые тексты или сведения об объекте, подбирать доводы в пользу определенной
концепции, соединять сведения о проблеме из смежных областей деятельности, выявлять
неявные тенденции в развитии объекта, т. е. узнать из выбранных текстов больше, чем
арифметическая сумма сведений в них об объекте. Широко цитируется образное определение
контент-анализа известного социолога и науковеда А. Г. Здравомыслова как «научно
обоснованного метода чтения между строк».
44
Особенности контент-анализа. Специалисты отмечают расширительное толкование
контент-анализа как обобщающего для всех методов, систематического и претендующего на
объективность анализа текстов. Идеи контент-анализа положены в основу интернет-поиска,
методик ранжирования результатов поиска.
Количественный характер контент-анализа позволяет аналитику сделать свои выводы
более обоснованными. Числовая оценка характеристик объекта в авторских текстах строится
на использовании качественных методов предметизации, систематизации, шкалировании
оценочных характеристик для выявления тенденций в развитии объекта. Поэтому более
точным для информационной аналитики можно считать следующее определение контентанализа: это систематическая числовая обработка, оценка и интерпретация формы и
содержания информационного источника.
Основная идея контент-анализа характеризуется как феномен настойчиво повторяющихся
с разной частотой тем, образов, ссылок на проблемы, оценок, утверждений, аргументов,
формальных конструкций, конкретных имен и т. д. Мерой может служить доля, которую
фиксируемые элементы текста занимают в общем объеме, и/или частота их встречаемости.
Назначение
контент-анализа.
Конкретные
прикладные
цели
контент-анализа
варьируются в широких пределах. Так, в 1952 г. американский исследователь Б. Берелсон
сформулировал 17 целей. В их числе:
1.описание тенденций в изменении содержания коммуникативных процессов;
2.описание различий в содержании коммуникативных процессов в различных странах;
3.сравнение отдельных СМИ;
4.выявление используемых пропагандистских приемов;
5.определение намерений и иных характеристик участников коммуникации;
6.определение психологического состояния индивидов и/или групп;
7.выявление установок, интересов и ценностей (систем убеждений и «моделей мира»)
различных групп населения и общественных институтов;
8.выявление фокусов внимания индивидов, групп и социальных институтов и др.
Очевидно, что приведенный перечень ориентирован лишь на нужды социальных наук —
социологии, политологии, социальных коммуникаций. В информационно-аналитической
деятельности он используется непрерывно, практически при выполнении любых запросов
пользователей. Варьируется лишь степень формализации и источники информации для
анализа.
Применение контент-анализа в информационно-аналитической деятельности. В
зависимости от решаемой задачи, контент-анализ используется на уровне единичных текстов,
их тематических подборок, потока документов и ссылок.
45
В информационно-аналитической деятельности чаще всего измеряются:
частота ключевых слов и словосочетаний, служащих для характеристики объекта;
повторяемость избранных объектов (имен, наименований фирм, марок продукции,
регионов, тематических направлений, научных и художественных школ и др.) в
некотором наборе документов,
объемы текстов, посвященных предмету исследования;
продуктивность журналов, издательств, авторов, доля соавторских работ по теме;
сила связи между публикациями по признакам социтирования;
оценивается вклад научных коллективов в разработку объекта.
Единицами измерения избираются не только КС и их сочетания, но и другие
характеристики анализируемого объекта — параметры, рейтинги, оценочные высказывания.
Частотный и поаспектный анализ текста — основные методы, разработанные и широко
используемые
в
информатике,
могут
быть
классифицированы
как
специальные
разновидности контент-анализа для аналитической деятельности.
В отличие от фундаментальных контент-аналитических исследований, информационный
аналитик не может планировать масштабного обследования с участием экспертов.
Оперативность и практическое назначение результатов — отличительные черты прикладных
специализированных методик контент-анализа. В этой связи в рамках информационной
диагностики можно дать следующее определение метода:
Контент-анализ — это алгоритмизированный и формализованный под определенную
аналитическую задачу процесс содержательного частотного анализа специально
отобранных документов, построенный на оценке наличия, расположения и/или частоты
появления в них семантических единиц текста.
Цель аналитика — поиск числовых закономерностей в распределении ключевых слов для
оценки состояния и тенденций развития знания об объекте или предметной области. Контентанализ позволяет:
соизмерять внимание к объекту авторов разных отраслей знания, научных школ, стран,
периодов времени;
оценивать актуальность проблемы в разные периоды времени;
сравнивать авторские позиции, предложенные прогнозы относительно конкретного
объекта;
выделять однородные группы ситуаций, объектов, их признаков, проблем, этапы и
направления развития предметного поля, научных и профессиональных сообществ.
46
Для информационного аналитика важна тематическая и содержательная динамика текстов
об объекте, поэтому чаще всего контент-анализ реализуется на хронологической шкале или
при обязательном учете времени создания или опубликования текстов. Задачи анализа
динамических объектов, как правило, заключаются в выделении стабилизированных
элементов текста, уходящих и новых. Особая задача аналитика — установление неявных
связей между объектами.
База исследования формируется аналитиком в точном соответствии с запросом и может
включать вторичные или первичные документы разного целевого назначения: материалы
конференций, обзорные публикации об объекте через какие-либо промежутки времени,
новостные сообщения СМИ, поток правовых актов и комментариев к ним, рекламных
материалов, авторефератов диссертаций и др.
В рамках информационной аналитики могут строиться разнонаправленные гипотезы.
Например, чем выше нарастающая частота упоминаний об объекте, тем актуальнее сведения
о нем.
Интент-анализ
10.
Усложнение аналитических задач ведет к использованию все более тонких инструментов
анализа текстов. Это позволяет аналитику просматривать сквозь синонимичные глаголы
«тайные замыслы» автора, умалчиваемые им сведения. Для их проявления можно
использовать «интент-анализ».
Термин «интенция» (лат. intentio — намерение, замысел) — коммуникативное намерение
говорящего. Задачей нового понятия было достижение более высокой точности в описании
иллокуции и иллокутивной функции — второго уровня анализа высказывания (наряду с
первым уровнем — локуцией и третьим — перлокуцией).
Так, на первом уровне локутивный аспект высказывания «Здесь темно» сводится к тому,
что это безличное предложение, произнесенное с нейтральной интонацией. На втором уровне
интенция включается в иллокутивный аспект — констатирующее высказывание может
побудить реципиента включить еще одну лампочку, перейти в более светлое помещение.
Кроме интенции, к иллокутивному аспекту относятся различные условия речевого акта (и
говорящий, и слушающий должны находиться в малоосвещенной комнате, оба говорить на
русском языке. Они должны быть заинтересованы в разрешении ситуации и т. д.). Третий
перлокутивный аспект включает соотнесение речевого акта с его результатом, т. е. выяснение
того,
действительно
ли
говорящему
удалось
побудить
слушающего
включить
дополнительный источник света.
Для облегчения улавливания интенций важно знать основные достижения этого
47
направления:
1. Явление интенции исследовалось как различие между начальным текстом (идеей) и
конечным.
2. Выраженная интенция может не совпадать с действительной интенцией (случаи
коммуникативных неудач текста или сознательного введения в заблуждение). С этих позиций
могут анализироваться выводы, если в основной части текста аналитик не находит оснований
для них.
3. Интенция выявляется лишь в контексте самой ситуации. Например, формальные
различия между предупреждением и угрозой отсутствуют, истинные намерения предприятия
участвовать в проекте замалчиваются.
4. Истинные
намерения
часто
определяются
на
основе
предшествующей
информации о ситуации в предметной области.
5. Нередко интенция уже по определению понимается как потенциальное (виртуальное,
мыслимое), противопоставленное высказанному (О. С. Ахманова и др.) или отождествляется
с целью высказывания (Я. Хоффманова). Более объективным остается все же стремление
автора к адекватному отображению имеющегося знания. Аналитик должен уметь
прогнозировать возможные цели и намерения авторов.
6. Специалисты тесно соотносят классификацию высказываний по их общей цели с
диагностикой интенций. Эта идея очень хорошо ложится и на жанровую специфику печатных
текстов. В ней аналитик должен видеть целевое назначение текста с учетом времени и места
публикации.
7. Диагностика интенций в тексте может осуществляться на основе внимательного
рассмотрения используемых глаголов. Для речевых коммуникаций Дж. Серль выделяет
закономерность: намерение объединяет обещания, клятвы, угрозы и ручательства, а желание
или потребность охватывает просьбы, приказы, команды, мольбы, ходатайства, прошения и
упрашивания. Для научных же и деловых текстов намерения будут различаться по глаголам
(предлагаю, требует внедрения, является перспективным и др.), наличию существительных,
привлекающих внимание определенной группы пользователей — инвесторов, клиентов,
городских властных структур, законодателей и т. д.
Таким образом, аналитикам еще предстоит сформировать прикладные методики интентанализа,
формировать
свою
классификацию
стандартных
несовпадений
между
высказыванием автора и реальным мотивом его воспроизведения в тексте.
11.
Казуальный анализ
Понятие причинности является одним из центральных в науке. Немецкий философ и
математик Г.В. Лейбниц сформулировал четвертый закон достаточного основания для
48
нахождения эмпирических или случайных истин: «Ничто не происходит без достаточного
основания». Этот закон можно считать в информационной аналитике основой для поиска
причинно-следственных связей на разных уровнях:
для отдельного высказывания;
возможных следствий появления конкретного текста;
причин активного развития микропотока документов;
причинно-следственных связей в развитии объекта.
Значительная часть заказов на аналитические исследования связана с поиском причинноследственных связей, хотя эта задача редко формулируется в прямом виде. Она скрыта в
запросах, предполагающих сравнительный анализ объектов-аналогов, оценку доли рынка,
факторов риска, сильных и слабых сторон конкурентов, прогноз цен и др.
Такую задачу можно назвать «вездесущей», так как аналитик решает ее практически в
каждом сложном запросе. Нередко она возникает в неявном виде многократно, даже без
прямого ее осознания. Аналитик отбирает доводы за и против, формулирует собственные
рекомендации, выявляет общее и отличительное.
В аналитической деятельности, в отличие от простых форм свертывания информации,
выявление причинно-следственных связей представляет собой ключевую компетенцию
исполнителя.
Может выступать и самостоятельной задачей информационной аналитики в широком
тематическом поле. Например, какие причины препятствуют активному использованию
корпоративных информационных систем на предприятиях после их внедрения? Какие
следствия могут фиксироваться во взаимоотношениях сотрудников после внедрения системы
нематериального стимулирования труда?
Потребность в анализе возникает для ситуаций особенных, сложных, не очевидных.
Поэтому предлагается назвать в целом формирующиеся методики для этой группы задач
«казуальным анализом», чтобы они в более явном виде ставились и решались аналитиком на
этапах интерпретации данных об объекте.
Понятия «казуальный» и «казус» имеют общий латинский корень (casualis
планирование (стратегическое, технико-экономическое, оперативно-календарное) –>
производственная
деятельность
(управление
производственными
процессами,
основные и вспомогательные процессы) –> хранение и упаковка готовой продукции –
> сбыт готовой продукции –> учет и отчетность, технико-экономический анализ
185
результатов.
Такая схема представляет собой укрупненную динамическую модель деятельности
предприятия и основу для получения карты основных информационных потоков. Затем
каждый самостоятельный блок может быть детализирован с необходимой степенью дробности
отображения процессов и операций, а также функций управления.
Разнообразное наполнение управленческих функций сводится к простейшей схеме:
–>
анализ
поступающей
сводно-аналитической
информации
–>
обсуждение
или
консультации с ответственными лицами –> принятие управленческого решения –>
доведение до исполнителей –> контроль и оценка исполнения –> анализ влияния результатов
на смежные области, функции или процессы –> корректировка планов соответствующего
уровня.
Нетрудно заметить, что все элементарные операции деятельности менеджеров высшего
звена и его помощников описываются очень сходной схемой с работой информационного
аналитика: поиск или получение информации, ее регистрация, анализ, поиск дополнительной
информации, расчеты показателей или логический анализ причинно-следственных связей,
обобщение информации в виде выводов или принятого решения, передача информации. Для
менеджеров среднего звена схема дополняется операциями контролирующей функции —
измерения, счета, взвешивания и др.
Информация — связующее звено между управляющими и управляемыми структурами,
объективно отражающая состояние объектов управления и определяющая их последующие
целенаправленные изменения. Принимается решение о принципиальной схеме обследования
потоков. В числе намеченных задач могут быть следующие:
1. Выявить и измерить реальные потоки документов между подразделениями и ведущими
специалистами, через отдельные подразделения, от одного специалиста к другим.
2. Определить критические точки в движении потоков информации на предприятии:
a) точки пересечения пути следования документов;
b) дублирующие совокупности документов;
c) точки высокой интенсивности проходящих документов.
Для анализа документооборота предприятия могут быть использованы:
реестры входящей и исходящей документации;
реестры финансовой и экономической отчетности;
прямые методы обследования — наблюдения, измерения, беседы с сотрудниками и
руководителями подразделений.
Потоки информации могут дифференцироваться по подразделениям, процессам или
186
объектам управления (здания и сооружения, оборудование, технологии, сырье, материалы и
комплектующие, кадры, продукция, финансы, информационные потоки).
6.
Картографирование потоков информации
Включает определение и нанесение на общую структурную карту предприятия точек
возникновения и назначения микропотоков документов, маршрутов и форм их передачи.
Точка — это подразделение предприятия, конкретный сотрудник или группа лиц,
ответственных за получение и работу с конкретными сообщениями. Это не обязательно
конечная точка использования информации, а лишь промежуточный этап регистрации или
преобразования
информации.
Первой
должна
использоваться
типизация
потоков
информации по характеру работы с сообщениями в точках их получения и преобразования.
В
частности,
возможные
операции:
регистрация,
копирование,
передача,
анализ,
преобразование, использование (для ознакомления, практических действий, получения
производной
информации),
утверждение,
удаление
(«утилизация»)
неиспользуемой
информации, хранение.
В схеме обязательно фиксируются также потоки информации, которые в какой-либо точке
копируются и затем передаются параллельно в несколько подразделений. Для этого
используются приказы, положения об отделах, должностные инструкции. Беседы с
сотрудниками позволят уточнить разновидности сообщений, канал и форму поступления
(письменный или электронный; по запросу, инициативно). По результатам этого этапа
обследования готовится карта движения потоков на предприятии. При построении карты
важно соблюдать некоторые правила:
обозримость в рамках выбранных масштабов и шрифтов;
фиксацию действий (характер работы с сообщениями) в точках назначения с помощью
минимального числа условных знаков;
четкое прослеживание маршрутов отдельных микропотоков с минимальным числом
пересекающихся и ломаных дуг;
обязательное пояснение использованных условных обозначений включая цветовые
(легенда), краткое текстовое описание схемы.
Общую карту целесообразно строить в матричной сетке в координатах «структурное
подразделение — микропотоки сообщений», которые были выделены по избранным
признакам (вид документов, канал поступления и др. — не более 15-20 основных
микропотоков).
В
строке
«структурное
подразделение»
может
фиксироваться
самостоятельное рабочее место, должность ответственного лица или группы. В поле матрицы
в этом случае будут отражаться маршруты движения, характер использования, взаимосвязи
187
между подразделениями и точки преобразования, использования, хранения. Возможно
включение потока устных распоряжений, консультаций, особенно при внедрении на
предприятии технологий управления знаниями.
На основе карты устанавливаются точки пересечения, хранения, использования и
утилизации
сообщений.
Принимается
решение
об
измерении
объемов
отдельных
микропотоков документов/данных в конкретных точках. Карта остается контрольным
инструментом для следующего этапа, может уточняться и детализироваться в процессе
измерений.
7.
Измерение потоков информации
Производится по журналам регистрации, протоколам корпоративной информационной
системы и отдельных рабочих мест. Измеряются: периодичность (частота) появления
сообщений в потоке, средний объем сообщений и совокупный (суммарный) объем потока,
интенсивность.
Единицей измерения могут избираться количество сообщений, их средний и суммарный
физический объем (количество печатных знаков с пробелами). Для измерения значимости
отдельных микропотоков могут использоваться относительные единицы – процентная доля
однократно используемых документов определенного вида в микропотоке к его совокупному
объему в единицу времени.
Иногда проводится анализ причинно-следственных связей.
На каждом предприятии велик совокупный объем сообщений, которые поступают
инициативно из внешней среды, не регистрируются (например, рекламные листки, прайслисты, коммерческие предложения и др.). Количественный объем в единицу времени
(ежедневный,
ежемесячный)
измеряется
только
в
том
случае,
если
микропоток
просматривается перед ликвидацией сообщений.
Если нет фиксированных сведений об объеме микропотоков, провод-тится его опытное
измерение за несколько временных отрезков (час, день, неделя). Например, в начале, середине
и в конце недели. Высчитывается среднее значение. В отдельных ситуациях важны сезонные
колебания в объеме микропотока. Чтобы не ждать периодов роста—падения, на основе беседы
с сотрудниками для среднего значения устанавливаются максимумы и минимумы значений
для сезонных периодов.
Частные и сводные таблицы измерений составляются для каждого подразделения точек
хранения (использования) или по видам документов.
8. Анализ логистических схем
188
На основании карт и таблиц составляется реальная логистическая схема для предприятия
в целом с необходимой ее детализацией по подразделениям или точкам пересечения, хранения
потоков информации. В процессе анализа выявляются:
критические точки — точки с максимальным объемом проходящей информации в
единице времени, превосходящим нормы и возможности ее качественной переработки или
использования;
дублирующиеся микропотоки документов (целевое копирование, неоправданное
дублирование);
избыточные микропотоки информации, доля используемых сообщений из которых
предельно низка;
пустые множества — микропотоки документов, не имеющие определенного характера
использования, обратной связи.
После тщательного анализа данных строится рекомендуемая логистическая схема
движения потоков информации с пояснительной запиской. В ней рационализируются
следующие моменты:
предлагаются пути движения микропотоков, минимизирующие трудозатраты и время
движения сообщений (речь идет не о простой передаче сообщения в корпоративной
информационной сети — она занимает секунды, а включая регистрацию, ознакомление,
согласование, изменения, подтверждение — отметка, подпись, печать);
обеспечивается ликвидация кризисных точек с учетом сезонных колебаний;
определяются нормативы обработки и прохождения документов по всему пути
следования.
Если поток содержит значительный объем спам-информации, то принимаются меры для
его ограничения — фильтры в электронной почте, первичный критический просмотр почты
на входе и др.
Рекомендации
обсуждаются,
уточняются,
согласовываются
с
подразделениями.
Утверждаются нововведения с обязательным этапом опытной проверки.
В практике отечественных предприятий применяются и другие варианты анализа реальной
логистической схемы. Например, составление и обработка карточки-анкеты связей всех
подразделений, включенных в каждый из видов информационного взаимодействия.
Результаты измерения микропотоков документов в них преобразуются в коэффициенты «вес
связей», который определяется как отношение исходящих и входящих документов.
Осуществляется анализ «весовой» схемы связей. В частности, констатируются некоторые
их особенности. Например, связи между заместителями генерального директора по экономике
и по производству достаточно налажены: движение потоков документов практически не
189
затруднено. Однако при передаче данных финансовому директору для формирования
производственной программы и оперативного учета у директора по производству нет
возможности обрабатывать их для предоставления в желаемом виде. Он не обладает
дополнительным временем, необходимым для перегруппировки и выборки из всей
имеющейся информации части, необходимой для предоставления заместителю генерального
директора по экономике. Данные функции также не могут быть возложены на
производственно-сбытовой отдел по причине отсутствия всей необходимой информации и
реального времени для выполнения данных функций. В этой ситуации необходимо
рассмотреть вариант, согласно которому данные функции следует передать производственносбытовому отделу, который, в свою очередь, недостающую информацию будет получать у
прямого начальника и контактировать с расчетно-вычислительным центром. В функции
расчетно-вычислительного центра (РВЦ) входит разработка соответствующих форм
предоставления внутренней документации, а также их составление. Несмотря на то, что
фактически между заместителем генерального директора по производству и расчетновычислительным центром связь налажена достаточно хорошо, работникам РВЦ не хватает
реального времени для выполнения поручений заместителя генерального директора по
производству. В связи с этим рекомендуется расширить штат сотрудников РВЦ с
закреплением за каждым из них определенного сектора подразделений, с которыми он будет
непосредственно контактировать.
Предложен пример некоторых промежуточных выводов, на основе которых производится
итоговая оценка результатов логистического обследования информационных потоков и
анализ возможности их реализации. Приведем примеры итоговых выводов с их
обоснованием.
Требуется реорганизация расчетно-вычислительного центра.
Роль РВЦ резко снизилась, что отчасти связано с отсутствием должного понимания
специфики информационной системы, ее эксплуатации, технологии обработки информации
в условиях рынка в целом. Основные функции РВЦ должны заключаться в накоплении,
систематизации и распространении информации по соответствующим подразделениям и
уровням управления предприятием. В настоящее время эти функции не выполняются. РВЦ
следует переименовать в информационно-аналитический центр или службу. Однако не
следует представлять деятельность вновь созданного отдела как усовершенствованную
работу РВЦ. Во-первых, информация — часто не просто перечень определенных
показателей, а отфильтрованная и проанализированная, синтезированная с помощью
современных методов обработки информация. Передача любой информации, не готовой для
принятия решений, не может считаться эффективной. Во-вторых, некоторые виды
190
информации
вообще
не
поддаются
количественной
оценке.
И,
в-третьих,
автоматизированная система располагает только формальными методами оценки, вместе
с тем, в некоторых случаях значение имеют многие качественные варианты оценки данных.
Все это обусловливает необходимость функционирования на предприятии особой службы, в
задачи которой входит также проведение анализа информации.
При составлении РВЦентром графика контактов с подразделениями предприятия особое
внимание следует уделить наиболее «загруженным» периодам: во время подготовки годового
собрания акционеров, при подготовке расчетов на участие в ежегодных тендерах, при
составлении годовой отчетности.
Требуется реорганизация отдела материально-технического обеспечения и комплектации в
связи с большим документооборотом, низким уровнем компьютерной грамотности и т. д.
В результате из широкого круга частных рекомендаций были приведены лишь 3 наиболее
реальные для выполнения задачи на текущий год:
преобразование расчетно-вычислительного центра в информационно-аналитическую
службу;
выполнение графика передачи информации подразделениям;
обучение сотрудников отдела материально-технического обеспечения работе с
программными продуктами ПЭВМ.
В результате логистического обследования аналитик получает:
1. Перечень структурных подразделений и ответственных лиц, участвующих в процессах
информационного взаимодействия на предприятии.
2. Перечень потоков информации, необходимых для выполнения каждой функции управления,
по основным и вспомогательным процессам;
3. Количественную оценку совокупного и распределенных микропотоков.
4. Точки возникновения, преобразования, использования и хранения сообщений.
5. Оптимизированные маршруты движения потоков информации с ликвидацией критических
точек по их анализу и использованию, пустых множеств, снижению избыточной и спаминформации.
6. Информационные взаимосвязи между структурными подразделениями по каждой функции
управления.
7. Степень использования (укрупненно) каждого вида информации, нормативы передачи и
хранения документов определенных разновидностей.
8. Перечень и объемы потоков информации, получаемой и передаваемой каждым структурным
подразделением.
Возможны и частные усовершенствования процессов. Например, разработка карт обратной
191
связи,
типовых
форм
преобразования
входящей
информации,
перераспределение
обязанностей сотрудников в критических точках и др.
Для себя аналитик осваивает внутрифирменные и внешние источники информации, место
и сроки их хранения.
Подобные исследования эпизодически проводились на предприятиях со второй половины
1960-х гг., когда начиналась разработка и внедрение автоматизированных систем управления,
в периоды активизации проблем научной организации труда. В настоящее время эта проблема
актуальна и решается многими предприятиями в связи с нарастающим потоком информации
и внедрением корпоративных информационных систем.
Логистика и аудит потоков информации о внешней среде предполагают не только
измерение, но и оценку содержания, качества источников информации, поступающих на вход
в систему, преобразование (синтезирование) наиболее значимой их части.
192