Du har säkert sett dessa i olika sammanhang där ”ord” i olika sammanhang arrangeras på olika sätt. Ofta skrivs vanligt förekommande ord med större bokstäver och mer centralt, men det finns även varianter som samlar orden i olika former som i sig representerar något som förhoppningsvis är relevant.
Det finns flera online tjänster som kan generera dessa, men här tänkte jag kika lite närmare på en variant baserad på öppen källkod som du kan köra själv lokalt.
Via https://github.com/amueller/word_cloud så finns det instruktioner för hur funktionen installeras via PIP eller Conda. Kommandot använder några andra bibliotek som också behöver installeras om de inte redan är det.
När man kör kommandot så skapas som standard en bild motsvarande den nedan.

Bilden ovan är genererad från Carl Michael Bellmans ”Tom är min flaska, tunnan utrunnen” med kommandot: wordcloud_cli –text tom_ar_min_flaska.txt –imagefile tom_ar_min_flaska.png
Genom kommandot wordcloud_cli –help så visas alla olika alternativ till genereringen.
Nedan visas exempelvis resultatet från ett något mer omfattande kommando som bygger på samma textfil med ord.

wordcloud_cli –text tom_ar_min_flaska.txt –imagefile tom_ar_min_flaska.png –mask flask_mask.png –min_word_length 4 –mode RGBA –no_normalize_plurals –background white
Kommandot har tillägg för en ”mask” som är en enkel bild i svart/vitt med en form som orden kommer att följa. Ord som är kortare än tre bokstäver ignoreras och bakgrunden anges som vit. Då texten är på svenska så finns inte pluralformen med –s på slutet, så detta används inte heller.
Kommandot slumpar resultatet, så man kan behöva köra det några gånger innan man hittar ett ordmoln som man tycker ser bra ut. Det går att ”låsa” genereringen med ett ”seed” nummer.
Om man vill att orden skall vara olika stora i förhållande till hur ofta de förekommer så kan man lägga till –relative_scaling 1 och om man vill ha en lite större bild så kan man ange en skalfaktor med –scale 2 (detta ger 2x så stor bild).
Möjligheterna är många fler, men det kan du själv experimentera med. Vad är exempelvis ursprunget till följande ordmoln?

Undrar vem som blir först att skapa ett QGIS plugin som fyller polygoner med ord från en textkälla i attributtabellen.
Jag vet! Jag vet!
Det är texten till låt som innehåller orden ”Dancing” och ”Queen” av ett svenskt band vars namn börjar och slutar med samma bokstav, och vunnit ESC -74 i England. 🙂
Kanske skulle haft en sillburk som form för ordmolnet? 😀