Onderzoekers ontwikkelden nieuw model voor efficiëntere spamfiltering

Pictogram voor leestijd 3 minuut. lezen


Lezers helpen MSpoweruser ondersteunen. We kunnen een commissie krijgen als u via onze links koopt. Tooltip-pictogram

Lees onze openbaarmakingspagina om erachter te komen hoe u MSPoweruser kunt helpen het redactieteam te ondersteunen Lees meer

Spam-e-mails zijn iets dat we allemaal verachten. Behalve dat ze worden gebombardeerd met irrelevante berichten, kunnen ze malware bevatten en phishing-inhoud die schade kan veroorzaken aan jou. Spamfilters spelen een cruciale rol om u ertegen te beschermen. Spamdetectormodellen kunnen automatisch spam detecteren, maar we moeten ze trainen op grote e-maildatasets en ze handmatig labelen. Dit hopen onderzoekers van het Sinhgad Institute of Technology Lonavala in India aan te pakken.

"Spamdetectie is essentieel omdat het gerechtigheid voor de verkopers kan garanderen en het vertrouwen van de koper in de online winkels kan behouden", zegt Vikas Samarthrao Kadam, een van de onderzoekers die betrokken zijn bij het studiedocument dat is gepubliceerd in de Internationaal tijdschrift voor intelligente robotica en toepassingen. “In tegenstelling tot andere methoden verbetert het de trainingssnelheid en efficiëntie van classificatie. Ons model zou kunnen verbeteren met de levenskwaliteit van mensen die grote hoeveelheden e-mails ontvangen, waardoor ze soepel door hun e-mail kunnen bladeren en hun accounts alleen voor het gewenste doel kunnen gebruiken.”

Het team ontwikkelde een model op basis van een multi-objective feature selection en adaptief capsulenetwerk, en trainde het op zowel beeld- als tekstdatasets. Dit model dat gebruik maakt van de deep learning-techniek zou een gemakkelijke implementatie bieden en binnen korte tijd snel kunnen worden getraind. Kadam zei dat hun eerste evaluaties aantonen dat het nieuwe model een grotere nauwkeurigheid heeft dan andere bestaande methoden. Het team merkte op dat dit kan helpen om de veiligheid van gebruikers te verbeteren en hen helpt om irrelevante e-mails beter en gemakkelijker te doorzoeken.

"Ons model verlaagt ook de trainingssnelheden en leidt tot een grotere efficiëntie van classificatie", zei Kadam in een interview met TechXplore. "In tegenstelling tot andere modellen verhoogt het de convergentiesnelheid van de detectie van spam-e-mail, waardoor betere resultaten worden behaald."

Aan de andere kant stelde de groep dat het model nog moet worden ontwikkeld om de grootst mogelijke efficiëntie in termen van snelheid en precisie te garanderen. Als het eenmaal klaar is, kan de techniek voor het filteren van spam niettemin op grote schaal worden gebruikt, ook op Gmail, Yahoo Mail en Outlook.

"De beveiliging van spamdetectie- en -filtratiesystemen is cruciaal om betere nauwkeurigheid en betrouwbare resultaten te bereiken, die in de toekomst kunnen worden verbeterd met behulp van ensemble learning," zei Kadam. “Het percentage valse positieven van veel modellen is nog steeds hoger dan vereist, maar zou in de toekomst tot de kleinst mogelijke waarde moeten worden teruggebracht. Realtime spamclassificatie is hard nodig, aangezien de meeste van de voorgestelde modellen niet goed werken met realtime gegevens... Bijna alle onderzoekers presenteren hun resultaten op basis van de nauwkeurigheid, precisie en herinnering van hun modellen, maar we zijn van mening dat de tijd complexiteit van machine learning-modellen moet ook worden beschouwd als een evaluatiemaatstaf, "zei Kadam. “Sommige onderzoekers laten veelbelovende resultaten zien in het proces van feature-extractie met behulp van een reeks woorden, omdat ze beweren dat de e-mailheader net zo belangrijk is voor spamdetectie als de inhoud van de body. Dus in de toekomst kan ook worden gedacht aan deep feature-extractie van de kopregel.”

Gebruikersforum

0 berichten