Naukowcy opracowali nowy model wydajniejszego filtrowania spamu
3 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
E-maile ze spamem to coś, czym wszyscy gardzimy. Oprócz bombardowania nieistotnymi wiadomościami, mogą zawierać złośliwe oprogramowanie i treści phishingowe, które mogą spowodować szkody Tobie. Filtry spamu odgrywają kluczową rolę w ochronie przed nimi. Modele wykrywaczy spamu mogą automatycznie wykrywać spam, ale musimy je przeszkolić na dużych zbiorach danych e-mail i ręcznie je oznaczyć. Właśnie to mają nadzieję rozwiązać naukowcy z Sinhgad Institute of Technology Lonavala w Indiach.
„Wykrywanie spamu jest niezbędne, ponieważ może zapewnić sprawiedliwość sprzedawcom i zachować zaufanie kupującego do sklepów internetowych” – powiedział Vikas Samarthrao Kadam, jeden z badaczy zaangażowanych w badanie opublikowane w International Journal of Intelligent Robotics and Applications. „W przeciwieństwie do innych metod poprawia szybkość treningu i skuteczność klasyfikacji. Nasz model może poprawić jakość życia osób, które otrzymują duże ilości e-maili, umożliwiając im płynne przeglądanie poczty i korzystanie z kont tylko w pożądanym celu”.
Zespół opracował model oparty na wielozadaniowym wyborze cech i sieci kapsuł adaptacyjnych, a następnie przeszkolił go w oparciu o zbiory danych obrazowych i tekstowych. Mówi się, że ten model wykorzystujący technikę głębokiego uczenia zapewnia łatwą implementację i można go szybko przeszkolić w krótkim czasie. Kadam powiedział, że ich wstępne oceny pokazują, że nowy model ma większą dokładność niż inne istniejące metody. Zespół zauważył, że może to poprawić bezpieczeństwo użytkowników i ułatwić im przeglądanie nieistotnych wiadomości e-mail.
„Nasz model zmniejsza również prędkość treningu i prowadzi do większej efektywności klasyfikacji” – powiedział Kadam w wywiadzie dla TechXplore. „W przeciwieństwie do innych modeli, zwiększa współczynnik konwergencji wykrywania spamu, osiągając lepsze wyniki”.
Z drugiej strony grupa stwierdziła, że model nadal wymaga rozwoju, aby zapewnić najwyższą wydajność pod względem szybkości i precyzji. Niemniej jednak po przygotowaniu technika filtrowania spamu może być stosowana na dużą skalę, w tym na gmail, Yahoo Mail i Outlook.
„Bezpieczeństwo systemów wykrywania i filtrowania spamu ma kluczowe znaczenie dla osiągnięcia lepszej dokładności i wiarygodnych wyników, które można poprawić w przyszłości za pomocą uczenia zespołowego” – powiedział Kadam. „Wskaźnik wyników fałszywie dodatnich w wielu modelach jest nadal wyższy niż wymagany, ale w przyszłości należy go zmniejszyć do najmniejszej możliwej wartości. Klasyfikacja spamu w czasie rzeczywistym jest bardzo potrzebna, ponieważ większość proponowanych modeli nie działa dobrze z danymi w czasie rzeczywistym… Prawie wszyscy badacze przedstawiają swoje wyniki w oparciu o dokładność, precyzję i przypominalność swoich modeli, ale czujemy, że czas złożoność modeli uczenia maszynowego powinna być również uważana za metrykę oceny” – powiedział Kadam. „Niektórzy badacze wykazują obiecujące wyniki w procesie ekstrakcji funkcji za pomocą worka słów, ponieważ twierdzą, że nagłówek wiadomości e-mail jest równie ważny dla wykrywania spamu, jak treść treści. Dlatego też w przyszłości można rozważyć głębokie wyodrębnianie cech linii nagłówka”.
Forum użytkowników
Wiadomości 0