Výskumníci vyvinuli nový model pre efektívnejšie filtrovanie spamu
3 min. čítať
Publikované dňa
Prečítajte si našu informačnú stránku a zistite, ako môžete pomôcť MSPoweruser udržať redakčný tím Čítaj viac
Spamové e-maily sú niečo, čím všetci opovrhujeme. Okrem toho, že sú bombardované irelevantnými správami, môžu obsahovať malvér a phishingový obsah, ktorý môže spôsobiť škodu vám. Spamové filtre zohrávajú dôležitú úlohu pri vašej ochrane pred nimi. Modely detektorov spamu dokážu automaticky rozpoznať spam, ale musíme ich trénovať na veľkých súboroch e-mailových údajov a ručne ich označiť. To je to, čo výskumníci z Sinhgad Institute of Technology Lonavala v Indii dúfajú, že budú riešiť.
„Detekcia spamu je nevyhnutná, pretože môže zabezpečiť spravodlivosť pre predajcov a udržať dôveru kupujúceho v online obchodoch,“ povedal Vikas Samarthrao Kadam, jeden z výskumníkov zapojených do štúdie publikovanej v International Journal of Intelligent Robotics and Applications. „Na rozdiel od iných metód zlepšuje rýchlosť tréningu a efektivitu klasifikácie. Náš model by sa mohol zlepšiť s kvalitou života ľudí, ktorí dostávajú veľké množstvo e-mailov, čo by im umožnilo plynulo prechádzať ich e-mailmi a používať svoje účty iba na požadovaný účel.“
Tím vyvinul model založený na multi-cieľovom výbere funkcií a adaptívnej kapsulovej sieti a trénoval ho na obrazových aj textových súboroch údajov. Hovorí sa, že tento model využívajúci techniku hlbokého učenia ponúka jednoduchú implementáciu a možno ho rýchlo trénovať v krátkom čase. Kadam povedal, že ich počiatočné hodnotenia ukazujú, že nový model má väčšiu presnosť ako iné existujúce metódy. Tím poznamenal, že to môže pomôcť zlepšiť bezpečnosť používateľov a pomôcť im lepšie a jednoduchšie prezerať nepodstatné e-maily.
"Náš model tiež znižuje rýchlosť tréningu a vedie k vyššej efektívnosti klasifikácie," povedal Kadam v rozhovore s TechXplore. "Na rozdiel od iných modelov zvyšuje mieru konvergencie detekcie spamových e-mailov a dosahuje lepšie výsledky."
Na druhej strane skupina uviedla, že model je ešte potrebné vyvinúť, aby sa zabezpečila maximálna účinnosť z hľadiska rýchlosti a presnosti. Akonáhle bude pripravená, môže byť technika filtrovania spamu použitá vo veľkom meradle, vrátane Gmail, Yahoo Mail a výhľad.
„Bezpečnosť systémov detekcie a filtrovania spamu je kľúčová na dosiahnutie lepšej presnosti a spoľahlivých výsledkov, ktoré možno v budúcnosti zlepšiť pomocou učenia sa súboru,“ povedal Kadam. „Miera falošných pozitívnych nálezov u mnohých modelov je stále vyššia, ako sa vyžaduje, ale v budúcnosti by sa mala znížiť na najmenšiu možnú hodnotu. Klasifikácia spamu v reálnom čase je veľmi potrebná, pretože väčšina navrhovaných modelov nepracuje dobre s údajmi v reálnom čase... Takmer všetci výskumníci prezentujú svoje výsledky na základe presnosti, presnosti a zapamätateľnosti svojich modelov, ale máme pocit, že čas Zložitosť modelov strojového učenia by sa mala tiež považovať za hodnotiacu metriku,“ povedal Kadam. „Niektorí výskumníci ukazujú sľubné výsledky v procese extrakcie funkcií pomocou vreca slov, pretože tvrdia, že hlavička e-mailu je pre detekciu spamu rovnako dôležitá ako obsah tela. V budúcnosti by sa teda dalo uvažovať aj o hĺbkovej extrakcii hlavičky.“
Používateľské fórum
0 správy