Электронная почта обладает многочисленными достоинствами, но именно из-за этих достоинств возникают основные риски, связанные с ее использованием. К примеру, доступ-ность электронной почты превращается в недостаток, когда пользователи начинают применять почту для рассылки рекламы, легкость в использовании и бесконтрольность приводит к утеч-кам информации, возможность пересылки разных форматов документов — к распространению вирусов и т.д.
В конечном итоге любой из этих рисков может привести к серьезным последствиям для компании. Это и потеря эффективности работы, и снижение качества услуг информационных систем, и разглашение конфиденциальной информации. Недостаточное внимание к данной проблеме грозит значительными потерями в бизнесе, а в некоторых случаях даже привлечением к юридической ответственности в связи с нарушением законодательства.
Компания подвергается данным рискам в силу ряда свойств электронной почты. Напри-мер, благодаря применению MIME-стандарта (Multipurpose Internet Mail Extensions) [20] элек-тронная почта может переносить большие объемы информации различных форматов данных в виде прикрепленных к сообщениям файлов. Такой возможностью сразу воспользовались зло-умышленники. Достоинство электронной почты превратилось в угрозу, поскольку электронная почта стала представлять собой практически идеальную среду для переноса различного рода "опасных" вложений, а именно компьютерных вирусов и т.п. Если надлежащий контроль за ис-пользованием электронной почты не обеспечен, это может привести к чрезвычайно серьезным последствиям и даже нанести непоправимый ущерб.
Количество незапрашиваемой рекламной корреспонденции (смама – от англ. spam) в электронных почтовых ящиках в последнее время постоянно растет. Одновременно развивают-ся и методы [21] борьбы со спамом. Усилия в этом направлении предпринимаются как на госу-дарственном уровне - путем принятия законов [22], так и на уровне техническом - путем разра-ботки высокоэффективных фильтров, отсеивающих нежелательную почту. Свои антиспамер-ские технологии совершенствовывают практически все крупные интернет - компании. Соответ-ствующие технологии [23] представили Microsoft, Yahoo, AOL (American on-line). В России свои технологии фильтрации спама тестируют и вводят в эксплуатацию "Яндекс", KM.ru и другие участники рынка. Наконец, в нашей стране была создана Национальная коалиция про-тив спама [24], в которую вошли компании Microsoft, Rambler, Mail.ru, Golden Telecom, Sub-scribe.ru и "Ашманов и партнеры".
Развиваются средства борьбы со спамом и в клиентском программном обеспечении. При этом развитие идет по нескольким направлениям. Первое связано с использованием принципа белых и черных списков, представляющие собой базу данных IP-адресов. В белом списке со-держатся адреса, почта, пришедшая с которых, заведомо спамом не является. Соответственно, черные списки выполняют противоположную функцию - сообщения, полученные с адресов из этих списков автоматически помечаются как спам и могут быть автоматически же удалены с сервера. Черные и белые списки формируются самим пользователем - соответственно, их эф-фективность возрастает со временем. Некоторые программы способны также пользоваться "общественными" черными списками, подгружаемыми со специализированных Интернет-ресурсов. Другое направление связано с фильтрацией на основе статистических алгоритмов Байеса (Th. Bayes). Теорема Байеса [25] используется для автоматического вычисления вероят-ности того, что сообщение является спамом. Для вычисления вероятности спама используются частотные словари, создаваемые в процессе обучения фильтра. Эти фильтры могут обучаться пользователем с целью достижения приемлемого для большинства приложений уровнем отсева нежелательной корреспонденции. Баесовский фильтр встраивается в большинство почтовых клиентов, в том числе в Mozilla [26], начиная с версии 1.3, и реализован в виде плагинов для других популярных программ наподобие Outlook и The Bat.
Появление новых антиспамерских технологий заставило спамеров принять меры для их обхода. Чтобы обойти фильтры, использующие статистические алгоритмы фильтрации, в рек-ламные письма пришлось вносить дополнительный "шум". В его качестве используются как случайные фразы, взятые, к примеру, из литературных произведений, так и случайные последо-вательности символов.
В результате всех этих спамерских действий распознавание фильтрами спама стало су-щественно затруднено. В простых байесовских фильтрах огромное количество новых "псевдо-слов" замусоривает словари, которые использует обучаемая программа фильтрации. Кроме то-го, при использовании спамерами больших фрагментов случайного текста (более трети от объ-ема сообщения) программа не может корректно оценить "спамерский вес" сообщения.
Более того, спамерам приходится постоянно менять технику обмана статистических фильтров, так как последние весьма быстро обучаются распознавать ухищрения авторов рек-ламных рассылок.
Таким образом проблема борьбы со спамом остается актуальной и требует для своего разрешения внедрения новых методов. Подход к защите должен быть всесторонним и ком-плексным – необходимо сочетать организационные меры с использованием соответствующих технических средств.
Цель работы – создать программный комплекс для эффективной работы с почтовыми серверами и почтовыми ящиками. Для достижения поставленных целей необходимо решение следующих задач:
• провести обзор методов распространения спама и существующих методов борьбы с ним;
• изучить почтовые протоколы с целью выявления их слабых мест;
• сформулировать требования, предъявляемые к программным комплексам для борьбы со спамом;
• разработать алгоритм борьбы с текстовым спамом;
• разработать структуру программного комплекса;
• оценить эффективность разработанных алгоритмов.
|