Навигация
Главная »  Интернет 

Поиск: статья Снова о корпоративном поиске


Информационные технологии уже давно обосновались в корпоративном секторе. Редкое предприятии не может не похвастаться добротно организованной локальной сетью и наличием различного специализированного ПО, обеспечивающего контроль информационных потоков, хранение документов и структуризацию информации с удобными отчетами о рабочем процессе.

Информационное разнообразие
Информацию на предприятии можно условно разделить на три вида. Как по ее виртуальному и вполне физическому месту расположению, так и по использованию в рабочем процессе. Это, во-первых, файлы на диске пользователя (плюс электронная почта и логи различного рода программ обмена мгновенными сообщениями типа ICQ или MSN Messenger). Во-вторых, это корпоративная информация, те же файлы документов различного формата и электронная почта (например, MS Exchange) или файловый информационный архив на сервере (серверах) предприятия. И, наконец, информация в разного рода информационных системах – DMS, PDM, CRM и так далее. Сюда можно включить все, начиная с объектов самих систем и документов в файловом архиве или в базе данных, например MS SQL, заканчивая внешними электронными сообщениями и документами, использующимися в работе системы.

Поиск?
Исходя из такого информационного разнообразия, можно сделать вывод, что в последнее время в корпоративном секторе весьма актуальна проблема поиска информации. В основном, компании сталкиваются с такими сложностями организации поиска, как физический объем базы, неструктурированность информации и наличие разных типов файлов, в которых содержатся нужные данные. В связи с этим спрос на совершенные инструменты поиска и обработки информации все более возрастает. Но кроме непосредственно организации поиска по всем информационным компонентам предприятия (не важно, файловый это архив, корпоративная электронная почта или система управления документами) к корпоративному поисковому ПО существует приличное количество иных требований. Это, конечно, работа с локальной сетью, что подразумевает клиент-серверную архитектуру ПО; соблюдение политик информационной безопасности и управление доступом пользователей; а также, что немаловажно, работа не вместо какой-либо уже установленной системы, а параллельно с ней, без нарушения настроенных бизнес-процессов. Остановимся на этих требования подробнее.

Критичные требования к корпоративному ПО
Возможность работы с локальной сетью подразумевает клиент-серверную архитектуру ПО, гибкие настройки сетевых политик, поддержку различных операционных систем и т.д. Одним из веяний времени стало также наличие веб-интерфейса клиентской части корпоративного ПО, что устраняет проблемы связанные с приобретением дополнительных рабочих мест при расширении информационной структуры. Такой вариант может обойтись дороже, так как при использовании веб-интерфейса количество клиентских мест не ограничено. Но выбор между веб-интерфейсом и самостоятельной программой-клиентом – дело зависящее от нужд и задач, которые предстоит решать при помощи приобретаемого ПО.
Следующим критичным фактором работы поискового ПО в рамках предприятия можно считать соблюдение политики информационной безопасности и управление доступом пользователей. Любая информационная система должна представлять собой структуру с четко определенными каналами обмена информацией как между пользователями так и с внешним миром. В связи с этим, любое корпоративное ПО должно отвечать жестким требованиям информационной безопасности. Разграничение доступа пользователей, многоуровневый доступ к различного рода информации, система авторизации и гибкая структура изменения политик безопасности в зависимости от запросов клиента.
Еще одной данностью можно считать такое свойство корпоративного ПО, как возможность работы с разного рода уже установленными на предприятии программными продуктами. Как уже упоминалось, информация в любой организации может содержаться как в файлах на диске или в СУБД, так и в каких либо информационных системах (не важно, что это будет – PDM, CRM или бухгалтерская программа). Именно поэтому третьим основным свойством любой информационной системы является возможность ее функционирования не вместо уже развернутого в организации ПО, а в связке с ним. Для корпоративной поисковой системы это еще более актуально, так как организация поиска по всем информационным источникам предприятия – это и есть главная задача внедрения именно поискового ПО.

Поисковый функционал
Кроме вышеперечисленных требований, которые, собственно, и ставят разного рода поисковые системы на уровень именно корпоративного программного обеспечения, нужно выделить и требования к функциональным возможностям данного ПО. Т.е. непосредственно к основным функциям программы, отвечающим за тот самый быстрый и эффективный поиск, становящийся все более и более востребованным. Во-первых, на смену прямому поиску (простым перебором) и поиску по только лишь атрибутам документов и объектов уже пришел полнотекстовый поиск с предварительной индексацией. Это более чем удобно и при условии более трудоемкого процесса поиска все равно в десятки раз быстрее.
Во-вторых, это поддержка различных форматов файлов (как распространенных, так и специализированных), а также безупречная работа с разного рода СУБД, информационными системами и т.д. Не стоит исключать из этого списка и уже ставшими незаменимыми средства электронной почты (TheBat! или MS Exchange например) и программ обмена мгновенными сообщениями типа ICQ или MS Messenger. Также всенепременным атрибутом высококачественной программы можно считать и набор поисковых возможностей: различные виды поиска (по фразе, или по отдельным словам), поиск с учетом морфологии и/или синонимов т т.д. и т.п. Ну и конечно, именно для корпоративного сектора с его гигантскими объемами информации, высокая скорость работы программы (как индексации данных, так и непосредственно поиска) – не пожелание, а необходимость.

Прогресс в поисках компромисса
Итак, с требованиями к корпоративному поисковому ПО мы определились. Теперь осталось выяснить, где же найти именно ту программу/систему, максимально близко отвечающую этим требованиям. Ибо доподлинно известно, что удовлетворить все без исключения запросы в принципе невозможно – всегда останутся дыры, которые придется прикрывать или дополнительными программами или сжиться с отсутствием каких-либо нужных функций или возможностей. Так что об идеале можно забыть, на месте ничто стоит... и то, что казалось безупречным вчера уже можно утилизировать к сегодняшнему вечером.
Вообще, разработки в области полнотекстового поиска в последнее время расцвели пышным цветом: благо Интернет подстегивает (Google тому пример), да и корпоративный сектор всегда подтягивается за самым-самым. Но разработки ведутся в основном зарубежными компаниями, притом или ставшими в последнее время богатыми и популярными Интернет-поисковиками или старичками на ниве поиска, начинавшими разработки в этой области еще 15-20 лет назад. Verity, iSYS, dtSearch – компании, разрабатывающие корпоративные поисковые системы, тому пример.
В отечественном же поле поиска пока глухо и пусто. Крупные компании, существующие уже несколько лет заняты совсем другим: антивирусы, управление документацией и бухгалтерией, разного рода защиты (файрволы и проч.), игры наконец и т.д. Несколько небольших компаний, правда, успели отличиться неплохими технологиями и программами настольного поиска, особенно хочется выделить среди них продукт Архивариус – удобная, симпатичная и функциональная программа для домашнего пользования. Не так давно и Яндекс порадовал домашних пользователей бесплатной поисковой утилитой, работающей со скоростью Яндекса. Все на виду: и удобный поиск, и поддержка морфологии, и сортировка по релевантности результатов и поддержка приличного количество форматов файлов, электронной почты и так далее.

Отечественные технологии поиска
Но с корпоративным сектором дала обстоят отнюдь не так радужно. Хотя есть один достойный пример. Достоинство его подчеркивается выбором сильных: в течение последнего года на технологию поиска и обработки информации небольшой российской компании СофтИнформ обратили внимание несколько крупных разработчиков разного рода корпоративного ПО. Среди них гранд-производитель систем управления документацией Hummingbird, выбравший программный продукт от СофтИнформ для встраивания в свои информационные системы. Также с недавних пор поисковые технологии СофтИнформ в виде отдельного модуля полнотекстового поиска используются в ПО управления проектной документацией PDM Lotsia Plus компании ЛоцияСофт. Это говорит о двух вещах. Во-первых, подтверждает уже не однажды высказанный тезис в необходимости использования полнотекстового поиска в разного рода приложениях, связанных с обработкой информации. И во-вторых, о доверии к разработкам именно отечественных программостроителей.
За счет чего же небольшая закрытое акционерное общество СофтИнформ смогла проделать путь (всего за год) от выпуска первой версии домашнего поисковика SearchInform Desktop до анонсирования корпоративной сетевой версии SearchInform Corporate Enterprise и интеграции с крупными разработчиками ПО управления документами? Перейдем непосредственно к рассмотрению технологи и продуктов на ее основе.

SoftInform Search Technology
SoftInform Search Technology – технология поиска и обработки информации, содержащейся в текстовых файлах на компьютере пользователя и в локальной сети предприятия, базах данных и информационных системах. По заявлениям разработчиков эта технология включает в себя все инструменты, необходимые для структуризации разрозненной информации в рамках предприятия и предоставляет собой эффективное решение любых проблем поиска и консолидации информации. Сделаем оговорку, что набор инструментов явно не полный, но признание разработки крупными компаниями дает право заявить о наличие вышеперечисленных в данном материале возможностей и учете требований корпоративного клиента.
Работа в локальной сети предприятия, наличие клиент-серверной архитектуры, нескольких линеек ПО, включая решения с веб-интерфейсом клиентской части и четкое соблюдения политик информационной безопасности и управления доступом пользователей: это вполне джентльменский набор характеристик. Но кроме этих де-факто для корпоративной системы, технология и ПО на ее основе от СофтИнформ может похвастаться двумя исключительно выдающимися возможностями, на которых, в общем-то и стоится успех продвижения продукта.
Во-первых, это запатентованная компанией СофтИнформ технология поиска документов, похожих по содержанию и смыслу на текст запроса. Это означает, что кроме обычного поиска по фразе или по атрибутам документов, в программах линейки SearchInform есть еще один вид поиска. Притом намного более интеллектуального, чем обычный поиск по фразе. На практике это позволяет решить несколько насущных проблем, таких как продолжительность поисковой сессии с постоянным подбором новых ключевых слов для поиска, сравнение всех документов уже содержащихся в информационной базе предприятия на предмет дублей и т.д. Практика показывает, что комбинирование обычного фразового поиска и поиска похожих документов позволяет с успехом и гораздо большей выгодой применять ПО для полнотекстового поиска в различных областях, от DMS до ERP и PDM.
Во-вторых, скорость работы поискового ПО СофтИнформ. Это критичный показатель для крупных предприятий. И тут скорости индексации и поиска (запатентованный алгоритм) более чем подходят для постоянно растущих потребностей корпоративного сектора. На данный момент версия SearchInform 2.0 индексирует данные со скоростью от 20 до 30 Гб/час на среднем офисном компьютере, что же касается использования мощных серверов, то в данном случае скорость возрастает на порядок. Притом, поддержка масштабирования дает возможность гибко варьировать мощность обрабатывающего информацию кластера серверов (если требуется).

Характерная конкретика
В принципе, без особого пафоса можно сказать, что на данный момент ПО на основе SoftInform Search Technology – одно из наиболее функциональных и быстрых по сравнению с аналогичными разработками решений. По крайней мере от отечественных производителей.

Краткие характеристики ПО на основе SoftInform Search Technology:
- Размер создаваемого индекса 20-25% от размера чистой текстовой информации

- Поддержка более 50 распространенных форматов файлов (включая архивы, PDF, MHT, CHM, MDB и т.д.).

- Индексирование и поиск информации в электронных сообщениях MS Outlook, Outlook Express и TheBat!, а также в логах программ мгновенного обмена сообщениями ICQ 99-2005, MS Messenger и Trillian)

- Клиент-серверная архитектура

- Разграничение прав доступа пользователей (как внутреннее в рамках системы, так и основанное на наследовании NTFS аутентификации Windows)

- Трехуровневое управление доступом пользователей к информации (к индексу, к источникам данных, к проиндексированным файлам)

- Индексирование информации в локальной сети предприятия, создание и использование сетевых индексов

- Концепция различных источников данных

- Гибкое внедрение в существующие информационные системы

- Сокращение времени на поиск документов и решение различного рода проблем поиска на предприятии

- Обеспечение информационной безопасности предприятия

- Языконезависимость

Плюс ко всему организация ядра технологии позволяет адаптировать SoftInform Search Technology (при внесении минимальных корректировок) под любую базу данных или информационную систему, благодаря концепции источников данных. Причем, источники данных, доступные для индексации нашей программой могут быть различны и могут находиться в разных местах. Это подтверждается как раз использованием моделей полнотекстового поиска от СофтИнформ уже в нескольких информационных системах, о которых говорилось выше.

 

 Microsoft, AOL и Yahoo! будут сдавать своих пользователей.
 Google разработала аналог Microsoft Passport.
 Microsoft больше не будет поддерживать старые версии Windows.
 Акции Google стремительно теряют в цене.
 Отказ в обслуживании в Opera.


Главная »  Интернет 

© 2017 Team.Furia.Ru.
Частичное копирование материалов разрешено.