ИНФОРМАЦИОННО-ПОИСКОВЫЕ
СИСТЕМЫ (ИПС) в химии, совокупность
лингвистич., программно-информац., технол. и техн. ср-в для ввода, хранения,
накопления, обработки, поиска и выдачи необходимой специалистам информации (документов
или фактов). Данная статья посвящена автоматизир. ИПС, к-рые могут кроме решения
перечисл. задач осуществлять также выпуск разл. информационно-справочных изданий,
в т.ч. указателей (напр., формульных). Элементы
ИПС: лингвистич. обеспечение - информационно-поисковые языки, к-рые служат для
ввода и поиска данных, рубрикаторы, тезаурусы, индексы разл. классификаций и
др.; программно-информац. обеспечение - пакеты прикладных
и спец. программ, банк данных (см. ниже), набор правил перевода запросов с естеств.
языка на информационно-поисковый и обратного перевода, а также совокупность
правил, или критерии соответствия, определяющие степень смысловой близости поискового
образа данных поисковым образам запросов; технол. обеспечение -набор методич.
документов, определяющих функционирование ИПС; техн. обеспечение - быстродействующая
ЭВМ, устройства телеобработки и телепередачи данных, микрофильмирования и др.
В зависимости от характера вводимой информации
ИПС условно подразделяют на документальные и фактографические. Документальные
ИПС (ДИПС) непосредственно не отвечают на вопросы, сформулированные в информац.
запросе, а только выдают наименования или осн. содержание хранимых исходных
документов (книги, статьи, техн. отчеты, патенты, правила и нормы, типовые химико-технол.
схемы и т.д.). Фактографические ИПС (ФИПС) непосредственно выдают в ответ на
запросы сведения по заданной теме (физ.-хим. константы и структурные ф-лы соед.,
семейства однотипных р-ций, типоразмеры оборудования и др.). ИПС
различаются охватом вводимой лит., поисковыми возможностями и видами подготавливаемых
информац. изданий. По объему обрабатываемой лит. ИПС подразделяют на крупномасштабные
(интегральные) и проблемные (проблемно-ориентированные), наз. также банками
данных (БД). Каждый БД - совокупность базы данных (множество сведений, хранимых
в памяти ЭВМ), лингвистич. и программных ср-в для поиска информации.
Одна из наиб. важных проблем при создании ИПС -
ввод структурных ф-л орг. соединений. Для этого используют в осн. системы бескодового
ввода (напр., графич. дисплеи, устройства оптич. считывания). Применяют также
разл. системы кодирования, напр., код Висвессера (блочный, канонический) или
произвольно-блочный (ПБ-код - неканонический). В памяти ЭВМ структурные ф-лы
соед. хранятся в виде поатомных таблиц связей (матриц связей). Для каждого вводимого
в ИПС соед. матрица связей сравнивается (идентифицируется) с матрицами связей
всех хранимых соединений. Новому соед. присваивается новый регистрац. номер;
если соед. с такой структурой было ранее зарегистрировано, записывается лишь
новая информация о нем из данной публикации. Из матриц связей в ИПС вырабатываются
спец. "фильтры", служащие для поиска индивидуальных соед. или их классов, а
также спец. записи для генерации информационно-справочных изданий.
ИПС в СССР. Информация в области хим. науки и технологии сосредоточена в осн. в Единой системе научно-техн. информации по химии (ЕС НТИ "Химия") и ряде др. систем (наиб. крупная из них - ИПС "АССИСТЕНТ"), действующих в составе Государств. автоматизир. системы научно-техн. информации СССР (ГАСНТИ).
ИПС "АССИСТЕНТ" обеспечивает обработку большинства опубликованных в мире источников информации по естеств. наукам и технике. В рамках этой ИПС подготавливается база данных, включающая библиографич. сведения и ключевые слова (БД БК) соотв. из 200 и 70 тыс. публикаций, проходящих ежегодно через реферативные журналы (РЖ) "Химия" и "Физ.-хим. биология и биотехнология". По 10 тыс. публикаций в год из РЖ "Коррозия и защита от коррозии" накапливает БД, включающий библиографич. списки, ключевые слова и рефераты (БД БКР). Накопленный ретроспективный фонд БД по химии составляет ок. 2 млн. публикаций; в одном сеансе поиска предоставляется массив за два года (500 тыс. публикаций). Поиск м. б. проведен по любому элементу библиографич. описания, фамилиям авторов, ключевым словам, индексам разл. классификаций (рубрикаторы ГАСНТИ, ВИНИТИ, УДК и др.). Поиск нужных данных проводится после поступления новой партии документов каждые две недели. Результаты поиска выдаются в виде микрокопий публикаций (микрофиш) или машинных распечаток, содержащих
библиографич. описания документов, фамилии авторов, ключевые слова и др., а также номера рефератов в РЖ.
Всесоюзный ин-т научной и техн. информации Государств. комитета СССР по науке и технике и АН СССР (ВИНИТИ) и Центр. ин-т информации хим. пром-сти ГДР в составе международной системы информации стран - членов СЭВ по химии и хим. технологии "ИНФОРМХИМ" и ИПС "АССИСТЕНТ" создают крупномасштабный банк структурных данных, в к-рый кроме сведении из БД БК включена информация о брутто-формулах, систематич. и тривиальных названиях, св-вах, р-циях и областях применения всех соед., вводимых в РЖ "Химия" (до 600 тыс. в год). В составе банка подготавливаются специализир. указатели (формульные, циклов, гетероэлементов, тривиальных назв.). Ретрофонд банка включает 2 млн. соединений.
В ЕС НТИ "Химия", являющейся частью "ИНФОРМХИМ", создаются отраслевые системы с помощью центр. органов информации ряда отраслей народного х-ва, напр. хим. и нефтеперерабатывающей пром-сти. Так, с 1983 генерируется база данных для системы "Технико-экономич. информация". Кроме того, формируются проблемно-ориентированные БД, ИПС по мол. спектрам орг. соед. (объем пополнения 20-30 тыс. спектров разл. в-в в год, фонд ок. 200 тыс. соед.) действует в Научно-информац. центре по мол. спектроскопии СО АН СССР; осн. виды поиска - нахождение спектра для соед. заданной структуры и структуры соед. по заданному спектру. В Ин-те высоких т-р АН СССР создана ИПС "ИВТАНТЕРМО", к-рая позволяет отыскивать нужные термодинамич. данные, а также рассчитывать термодинамич. характеристики хим. р-ций.
В составе одной из отраслевых систем автоматизир. проектирования функционирует "Автоматизир. всесоюзная единая система теплофиз. абонирования" ("АВЕСТА"), к-рая включает след. БД: основные физ.-хим. параметры и их эксперим. значения; методики расчетов теплофиз. св-в индивидуальных соед., бинарных и многокомпонентных смесей, нефтей и нефтяных фракций; библиографич. источники.
В ВИНИТИ работает ИПС по химии фторорг. соед. ("Фтор"). Ее особенность - возможности поиска типов орг. р-ций (по видам хим. связей), а также сведений о р-циях получения заданных классов соед. и р-циях, в к-рые они вступают. Возможен поиск информации о биологически активных фторорг. соед. и областях их применения. Информац. массив превышает 1 млн. р-ций (объем пополнения 50 тыс. р-ций в год). Поскольку химия фторорг. соед. включает орг. соед. всех классов, ИПС "Фтор" можно рассматривать практически как банк р-ций орг. химии.
Отечеств. и зарубежную информацию по естеств. наукам и технике представляет на магн. лентах и в режиме теледоступа Государств. публичная научно-техн. библиотека. НПО "ПОИСК" разрабатывает крупномасштабную информац. систему патентной мировой документации "ТЕМП-1" (объем базы данных более 7 млн. документов, опубликованных в 1970-1У8Ь).
ИПС за рубежом. В США на базе РЖ "Chemical Abstracts" ("СА") создана наиб. крупная зарубежная интегральная ИПС - "Chemical Abstracts Service" ("CAS"). В ее состав входят подсистема "Chemical Registry", включающая информацию о более чем 8 млн. соед. (структурные и брутто-формулы, систематич. и тривиальные назв., регистрац. номера и номера рефератов), и подсистема, обеспечивающая поиск и прямую выборку нужных соед. из информац. массива. ИПС "CAS" подготавливает ряд БД по отд. проблемам химии и, кроме того, БД "СА" "Search", содержащий библиографич. описания всех публикаций, все предметные понятия и названия соединений. С 1983 ИПС "CAS" участвует в создании международной спутниковой телекоммуникац. сети научно-техн. информации по хим. наукам и пром-сти. В Ин-те научной информации (Филадельфия)
действует ИПС, к-рая на основе обработки более 100 хим. журналов подготавливает ряд информац. изданий: "Current Abstracts of Chemistry and Index Chemicus", "Chemical Substructure Index", указатель цитированной лит. "Citation Index" и др. В подсистеме "Index Chemicus Registry System" накоплен информац. массив, превышающий 3 млн. соед. (объем пополнения ок. 200 тыс. в год).
В Великобритании разработана ИПС "Computerized Retrieval of Organic Structure Based on Wiswesser" ("CROSBOW"), в к-рой в память ЭВМ с помощью кода Висвессера вводится информация о новых соед. (общий массив более 3,5 млн.) из ИПС Ин-та научной информации (Филадельфия).
Во Франции действует ИПС "Telesystemes Questel Plus", включающая ряд проблемных БД, в т.ч. систему поиска соед. по структурным ф-лам "Le systeme de description et d'automatisation des recherches, de correlation" ("DARC"). В последней системе информац. массив (превышает 5 млн. соед., объем пополнения 300 тыс. в год) накапливается с 1965 на основе сведений из ИПС "CAS" и БД "Derwent" (патентная информация). Данные ИПС "DARC" предоставляются в страны Европы через информац. сеть EURONET, в др. страны - через сети TUMNET и TELENET. В Национальном центре науч. исследований функционирует ИПС "Programme Applique a la Selection et a la Compilation Automatiques de la Literature" ("PASCAL"). Эта система осуществляет обработку лит. по теоретич., физ. и фармацевтич. химии и хим. технологии (более 100 тыс. публикаций в год) и подготавливает соответствующие БД, а также РЖ "Bulletin Signaletique" и указатели к нему.
В ФРГ создается западногермано-японская интегральная ИПС "Internationale Documentationsgesellschaft fur Chemie" ("IDC"), производящая поиск нужных соед. по структурным фрагментам, в основе к-рых лежит связь углерод-гетероатом.
Из проблемно-ориентированных банков, создаваемых за рубежом, в СССР широко используется БД "Cambridge Structural Database" - Кембриджский банк кристаллографич. данных, включающий сведения (с 1935) о кристаллич. структурах ок. 40 тыс. орг. и металлоорг. соединений.
Ускорение научно-техн. прогресса в химии требует дальнейшего развития системы информац. обеспечения. Поэтому в разл. странах продолжаются работы по совершенствованию действующих, а также созданию и вводу в эксплуатацию новых ИПС для получения сведений о токсикологич. и экологич. св-вах разнообразных соед., о способах ресурсосбережения в процессах хим. технологии, их интенсификации и надежности, о причинах возникновения и путях предотвращения аварий в хим. произ-вах и др. Важная ф-ция ИПС - обеспечение и пополнение информацией САПР, систем управления и научных исследований, а также разл. интеллектуальных систем поиска оптим. решений и проблемно-ориентированных БД (см., напр., Искусственный интеллект).
=== Исп. литература для статьи «ИНФОРМАЦИОННО-ПОИСКОВЫЕ»: Михайлов А. И., Чёрный А. И., Гиляревский Р. С., Научные коммуникации и информатика, М., 1976; Бондарь В. В. [и др.], "Научно-техническая информация", сер. 1, 1984, №2, с. 15-22; Коптюг В. А., в сб.: Д. И. Менделеев, 150 лет со дня рождения, М., 1986, с. 166-84; "J. of Chemical Information and Computer sciences", 1985, v. 25, № 3, n. 170-80, 186-97, 258-63, 271-75, 326-33; Communication, storage and retrieval of chemical information, N. Y., 1985; Потапов В. М., Кочетова Э. К., Химическая информация. Справочник, 2 изд., М., 1988. Г. Л. Мищенко.