Информационно-поисковые системы (ИПС)
ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ (ИПС) в химии, совокупность лингвистич., программно-информац., технол. и техн. ср-в для ввода, хранения, накопления, обработки, поиска и выдачи необходимой специалистам информации (документов или фактов). Данная статья посвящена автоматизир. ИПС, к-рые могут кроме решения перечисл. задач осуществлять также выпуск разл. информационно-справочных изданий, в т.ч. указателей (напр., формульных). Элементы ИПС: лингвистич. обеспечение - информационно-поисковые языки, к-рые служат для ввода и поиска данных, рубрикаторы, тезаурусы, индексы разл. классификаций и др.; программно-информац. обеспечение - пакеты прикладных и спец. программ, банк данных (см. ниже), набор правил перевода запросов с естеств. языка на информационно-поисковый и обратного перевода, а также совокупность правил, или критерии соответствия, определяющие степень смысловой близости поискового образа данных поисковым образам запросов; технол. обеспечение -набор методич. документов, определяющих функционирование ИПС; техн. обеспечение - быстродействующая ЭВМ, устройства телеобработки и телепередачи данных, микрофильмирования и др. В зависимости от характера вводимой информации ИПС условно подразделяют на документальные и фактографические. Документальные ИПС (ДИПС) непосредственно не отвечают на вопросы, сформулированные в информац. запросе, а только выдают наименования или осн. содержание хранимых исходных документов (книги, статьи, техн. отчеты, патенты, правила и нормы, типовые химико-технол. схемы и т.д.). Фактографические ИПС (ФИПС) непосредственно выдают в ответ на запросы сведения по заданной теме (физ.-хим. константы и структурные ф-лы соед., семейства однотипных р-ций, типоразмеры оборудования и др.). ИПС различаются охватом вводимой лит., поисковыми возможностями и видами подготавливаемых информац. изданий. По объему обрабатываемой лит. ИПС подразделяют на крупномасштабные (интегральные) и проблемные (проблемно-ориентированные), наз. также банками данных (БД). Каждый БД - совокупность базы данных (множество сведений, хранимых в памяти ЭВМ), лингвистич. и программных ср-в для поиска информации. Одна из наиб. важных проблем при создании ИПС - ввод структурных ф-л орг. соединений. Для этого используют в осн. системы бескодового ввода (напр., графич. дисплеи, устройства оптич. считывания). Применяют также разл. системы кодирования, напр., код Висвессера (блочный, канонический) или произвольно-блочный (ПБ-код - неканонический). В памяти ЭВМ структурные ф-лы соед. хранятся в виде поатомных таблиц связей (матриц связей). Для каждого вводимого в ИПС соед. матрица связей сравнивается (идентифицируется) с матрицами связей всех хранимых соединений. Новому соед. присваивается новый регистрац. номер; если соед. с такой структурой было ранее зарегистрировано, записывается лишь новая информация о нем из данной публикации. Из матриц связей в ИПС вырабатываются спец. "фильтры", служащие для поиска индивидуальных соед. или их классов, а также спец. записи для генерации информационно-справочных изданий.
ИПС за рубежом. В США на базе РЖ "Chemical Abstracts" ("СА") создана наиб. крупная зарубежная интегральная ИПС - "Chemical Abstracts Service" ("CAS"). В ее состав входят подсистема "Chemical Registry", включающая информацию о более чем 8 млн. соед. (структурные и брутто-формулы, систематич. и тривиальные назв., регистрац. номера и номера рефератов), и подсистема, обеспечивающая поиск и прямую выборку нужных соед. из информац. массива. ИПС "CAS" подготавливает ряд БД по отд. проблемам химии и, кроме того, БД "СА" "Search", содержащий библиографич. описания всех публикаций, все предметные понятия и названия соединений. С 1983 ИПС "CAS" участвует в создании международной спутниковой телекоммуникац. сети научно-техн. информации по хим. наукам и пром-сти. В Ин-те научной информации (Филадельфия) действует ИПС, к-рая на основе обработки более 100 хим. журналов подготавливает ряд информац. изданий: "Current Abstracts of Chemistry and Index Chemicus", "Chemical Substructure Index", указатель цитированной лит. "Citation Index" и др. В подсистеме "Index Chemicus Registry System" накоплен информац. массив, превышающий 3 млн. соед. (объем пополнения ок. 200 тыс. в год). В Великобритании разработана ИПС "Computerized Retrieval of Organic Structure Based on Wiswesser" ("CROSBOW"), в к-рой в память ЭВМ с помощью кода Висвессера вводится информация о новых соед. (общий массив более 3,5 млн.) из ИПС Ин-та научной информации (Филадельфия). Во Франции действует ИПС "Telesystemes Questel Plus", включающая ряд проблемных БД, в т.ч. систему поиска соед. по структурным ф-лам "Le systeme de description et d'automatisation des recherches, de correlation" ("DARC"). В последней системе информац. массив (превышает 5 млн. соед., объем пополнения 300 тыс. в год) накапливается с 1965 на основе сведений из ИПС "CAS" и БД "Derwent" (патентная информация). Данные ИПС "DARC" предоставляются в страны Европы через информац. сеть EURONET, в др. страны - через сети TUMNET и TELENET. В Национальном центре науч. исследований функционирует ИПС "Programme Applique a la Selection et a la Compilation Automatiques de la Literature" ("PASCAL"). Эта система осуществляет обработку лит. по теоретич., физ. и фармацевтич. химии и хим. технологии (более 100 тыс. публикаций в год) и подготавливает соответствующие БД, а также РЖ "Bulletin Signaletique" и указатели к нему. В ФРГ создается западногермано-японская интегральная ИПС "Internationale Documentationsgesellschaft fur Chemie" ("IDC"), производящая поиск нужных соед. по структурным фрагментам, в основе к-рых лежит связь углерод-гетероатом. Из проблемно-ориентированных банков, создаваемых за рубежом, в СССР широко используется БД "Cambridge Structural Database" - Кембриджский банк кристаллографич. данных, включающий сведения (с 1935) о кристаллич. структурах ок. 40 тыс. орг. и металлоорг. соединений. Ускорение научно-техн. прогресса в химии требует дальнейшего развития системы информац. обеспечения. Поэтому в разл. странах продолжаются работы по совершенствованию действующих, а также созданию и вводу в эксплуатацию новых ИПС для получения сведений о токсикологич. и экологич. св-вах разнообразных соед., о способах ресурсосбережения в процессах хим. технологии, их интенсификации и надежности, о причинах возникновения и путях предотвращения аварий в хим. произ-вах и др. Важная ф-ция ИПС - обеспечение и пополнение информацией САПР, систем управления и научных исследований, а также разл. интеллектуальных систем поиска оптим. решений и проблемно-ориентированных БД (см., напр., Искусственный интеллект).
Литература