hh.sePublikationer
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Forensic Authorship Analysis of Microblogging Texts Using -Grams and Stylometric Features
Högskolan i Halmstad, Akademin för informationsteknologi.
Institute of Computer Science, University of Tartu, Tartu, Estonia.
Högskolan i Halmstad, Akademin för informationsteknologi, Halmstad Embedded and Intelligent Systems Research (EIS), CAISR Centrum för tillämpade intelligenta system (IS-lab).ORCID-id: 0000-0002-1400-346X
2020 (Engelska)Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

In recent years, messages and text posted on the Internet are used in criminal investigations. Unfortunately, the authorship of many of them remains unknown. In some channels, the problem of establishing authorship may be even harder, since the length of digital texts is limited to a certain number of characters. In this work, we aim at identifying authors of tweet messages, which are limited to 280 characters. We evaluate popular features employed traditionally in authorship attribution which capture properties of the writing style at different levels. We use for our experiments a self-captured database of 40 users, with 120 to 200 tweets per user. Results using this small set are promising, with the different features providing a classification accuracy between 92% and 98.5%. These results are competitive in comparison to existing studies which employ short texts such as tweets or SMS. ©2020 IEEE 

Ort, förlag, år, upplaga, sidor
IEEE, 2020.
Nyckelord [en]
Authorship Identification, Authorship Attribution, Stylometry, N-Grams, Microblogging, Forensics
Nationell ämneskategori
Signalbehandling
Identifikatorer
URN: urn:nbn:se:hh:diva-41798OAI: oai:DiVA.org:hh-41798DiVA, id: diva2:1416649
Konferens
8th International Workshop on Biometrics and Forensics (IWBF 2020), Porto, Portugal, April 29-30, 2020
Forskningsfinansiär
VetenskapsrådetKK-stiftelsen
Anmärkning

Other funding: European Social Fund via IT Academy programme.

Tillgänglig från: 2020-03-24 Skapad: 2020-03-24 Senast uppdaterad: 2020-03-26

Open Access i DiVA

fulltext(565 kB)17 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 565 kBChecksumma SHA-512
c2e477c8ce76163e1612be0a69cfa44037170e0db3afdee740109095078cb744d356ce2ede898cfa1626c7f56555be7aac65f7b2552412163ec6d44e46c35364
Typ fulltextMimetyp application/pdf

Personposter BETA

Alonso-Fernandez, Fernando

Sök vidare i DiVA

Av författaren/redaktören
Alonso-Fernandez, Fernando
Av organisationen
Akademin för informationsteknologiCAISR Centrum för tillämpade intelligenta system (IS-lab)
Signalbehandling

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 17 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 32 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf