Etiket bulutları bir yazı içinde geçen kelimelerin sık tekrarlananlarını seçen, bunları şematik bir düzende bir araya getirip en çok kullanılanları daha büyük gösteren bir tekniktir. Bu teknikle, pek çok sitenin, romanın, tezin, ifadenin ve yazının temeli ve vurguladığı anlamlar analiz edilebilir. Gelin, bu işi yapan online servisleri ve yaptığım örnekleri gezelim

gtitagcloud
Güneşin Tam İçinde anasayfa/homepage etiket bulutu – Wordle kullanılmıştır

KELİME BULUTU NASIL YAPILIR?

ETİKET BULUTLARINI (TAG CLOUDS)
NASIL HAZIRLIYORUZ?

Bu analizlerde kullandığım iki site var:
Wordle.net ve Tagul.com

Wordle.net kullanımı basit bir site. http://www.wordle.net/create adresine girip elinizdeki metni yapıştırmanız ya da alttaki kutuya istediğiniz web sitesinin rss adresini vermeniz yetiyor. (Wordle’ın çalışabilmesi için çoğu bilgisayarda yüklü olan JAVA bilgisayarınızda yüklü olmalı. Eğer sitesinde yüklemenizi istiyorsa, çekinmeden yükleyebilirsiniz. Elle kendiniz yüklemek isterseniz www.java.com)

tagularabirim

Tagul ise daha profesyonel bir yaklaşım gösteriyor. Oluşan etiket bulutu o sitede aramalarda kullanılabiliyor ve JAVA yerine Flash sistemini kullanarak daha çok kişiye ulaşıyor. Siteye “sign up” ile üye olunuyor. Üye olduktan sonra “Sign in” ile giriş yapılıyor. Bir kaç adımda istenen site adresi verilip etiketleri bul (Fetch the tags) deniyor. Ardından yazıtipi ve stili seçiliyor. Ben Türkçe harfleri düzgün göstermesi için birkaç yazıtipi denedikten sonra belirledim. Tagul’da en çok uğraştıran ise bu etiket bulutunda anahtar kelimeye tıklanınca ilgili sitenin içinde aratmaktı. Bunun için googleın site içi arama URLsini aldım ve bunu tagul’un verdiği $tag ile birleştirdim. (http://www.google.com/search?hl=tr&q=site%3Awww.milliyet.com.tr++$tag) şeklinde. Bu örnekte elbette www.milliyet.com.tr yerine sizin üzerinde çalıştığınız web adresi gelmeli.

Teknik detayı uzatmıyorum. Analizlere geçelim.

ANALİZ1) WEB SİTELERİ ZİYARETÇİLERE ASLINDA NE ANLATIYOR?

Türkiye’nin en çok ziyaret edilen sitelerini saptamak için genellikle Alexa verilerini kullanıyoruz. Gerçi Alexa verileri %100 doğruluk sağlamaz ama gerçeğe en yakın sektör analizleri ve karşılaştırmalı site analizleri burada yapılır. Türkiye için en çok ziyaret edilen web siteleri Alexa listesi de şurada: http://www.alexa.com/topsites/countries/TR

MİLLİYET GAZETESİ WEB SİTESİ

Bir örnek sunarsam tümünü yapmaya gerek kalmadan işin ruhunu görmüş olacaksınız. Aşağıda www.milliyet.com.tr için Tagul ve Wordle ile yaptığım örnekleri görüyorsunuz. Bir gazetenin haberleri sürekli değişeceği için bu etiket bulutu hergün yeniden oluşturulmalıdır.

WORDLE – Milliyet – http://www.milliyet.com.tr
millliyettags

TAGUL – Milliyet – http://www.milliyet.com.tr

ANALİZ 2) POLİTİKACILAR ASLINDA NE DİYORLAR?
AMERİKAN BAŞKANLARININ ETİKET BULUTLARI

obamaonblack
Obama’nın Konuşması

Bu adreste çok ilginç bir analiz var. ABD devlet başkanlarının (bu örnekte Obama, Bush, Clinton, Reagan, Lincoln ele alınmış) göreve gelişleri ile ulusa sesleniş konuşması yapmaları bir gelenek. Bu konuşmalar, etiket bulutu analizinden geçirildiğinde mesajlarda bazı kelimeler müthiş öne çıkıyor. Sanki bu kelimelerin karşıladığı anlamları temin edeceklerine dair güvence vermek istemişler.

bushspeech
Bush’un konuşması – Beklendiği gibi terörizm, Irak ve özgürlük getirmek üzerine kurulu. Yorum yapmayacağım. Olan bitenleri hepimiz gördük.

Bu çeşit bir çalışma ülkemiz Başbakanları ve Cumhurbaşkanları için yapıldı mı bilmiyorum? Yapılmadıysa sosyal alanlarda akademik çalışma yapan bir akademisyen için bence ilginç bir tez konusu olacaktır. Ayrıca önemli kişilerin önemli konuşmalarının listesi şurada arşivlenmiş ki incelemek isteyenler için harika bir kaynak. Şu sitede de Bill Gates’in bir konuşması etiket bulutu haline getirilmiş.

lutherking
Martin Luther King, Jr. | “I Have a Dream” konuşmasının etiket bulutunu oluşturduğumda beklediğim gibi Freedom / özgürlük kelimesi birinci geldi. Bu konuşmayı zenci vatandaşların hakları için yapmıştı ve negro kelimesini rahatça kullanmıştı. Bugün “Afrika kökenli Amerikalı”dan başka bir tanımlama kelimesi kullanmanız doğrudan hakaret sayılıyor.

ANALİZ 3) HABER SİTELERİNDE EN ÇOK ARANAN KELİMELER GÜNDEME IŞIK TUTAR

nytimestags
http://www.nytimes.com/gst/mostsearched.html?format=tagcloud&period=1

The New York Times’ın bu sayfasında sitede en çok aranan kelimelerden oluşan etiket bulutunu görüyoruz. Bu elbette gündemin ne olduğunu bize açıkca gösteriyor. Son 24 saat, 7 gün 30 gün gibi seçenekler var. (Size küçük ödevcik: Türkçe haber sitelerinde bu özellik var mı? Varsa etiket olarak sunuyorlar mı?)

ANALİZ 4) KİTAPLARIN ETİKETİ, ÖZETLERİNDEN ETKİLİDİR
KLASİK ROMANLARIN ETİKET BULUTLARINI YAPMAK

Fikir çok güzel ama kitapların yazılı metinlerini nereden bulacağız?” diyorsanız, dünya genelinde basıldıktan sonra 70 sene geçen eserlerin telif hakları bitiyor. Böylece Gutenberg projesinde yerlerini alıyorlar. İstenilen bir kitap yasal şekilde aratılıp içinde analiz yapılabilir.
Gutenberg Projesi : http://www.gutenberg.org/ En çok indirilen kitap listesini de taramak isteyebilirsiniz.

Örneğin sizin için ALICE’S ADVENTURES IN WONDERLAND (Alice Harikalar Diyarı’nda) kitabını aratıp düzyazı .txt formatında görüntülettim.
http://www.gutenberg.org/files/11/11.txt

Bu sayfayı Wordle.net’te etiket bulutuna dönüştürdüğümde çıkan sonuç aşağıda
(İlk kutuya romanın tamamını yapıştırırken, Gutenberg projesinin sayfanın başına ve sonuna eklediği yasal uyarı metinlerini silmeye dikkat etmelisiniz)

alicewonderlandtags

Annabel Lee çok güzel bir şiirdir. Şair: Edgar Allan POE
annabellaingtag

Annabel Lee (Türkçe) Şair: Edgar Allan POE Çeviren : Melih Cevdet ANDAY
annabelleturkcetag

Ulysses James Joyce tarafından yazılmış efsane kitaptır. Orijinal dilindeki etiket bulutunu aşağıda oluşturdum.
ulysses

Küçük Prens (Le Petit Prince) için etiket bulutu aşağıda.
kucukprens

ANALİZ 5) YASANIN RUHU
ANAYASALARIN ETİKET BULUTLARINI YAPMAK

Aklıma 1982 anayasasını etiket bulutu ile görmek geldi. Aşağıdaki tabloyu bozan tek kelime Madde kelimesi bence. Anasayadaki her bir kavram için ayrı madde kelimesi geçtiğinden en çok tekrar eden kelime o oluyor. Madde kelimesini çıkarmayı düşündüm. Metnin tamamından çıkarınca tablo değişecekti. Fakat sürekli madde denilmiş olması bile bence anlam taşıyor. Bu nedenle müdahale etmedim. Aşağıda anayasamızın tam metninden oluşan etiket bulutu görülüyor.

Türkiye Cumhuriyeti 1982 Anayasası – http://www.tbmm.gov.tr/anayasa.htm
anayasa1982

United States Declaration of Independence | Amerikan Bağımsızlık Bildirgesi
abdbildirge

Türkçe – Amerikan Bağımsızlık Bildirgesi
abdbildirgeturkce

ANALİZ 5) MİLLİ MARŞLARIN SÖZLERİ
İSTİKLAL MARŞI GİBİ DİĞER ÜLKELERİN MARŞLARI HANGİ YÜKSEK ÜLKÜLERİ SAVUNUYOR?

Türkiye – İstiklal Marşı (10 kıtası)
istiklalmarşı

God Save the Queen | Birleşik Krallık Ulusal Marşı
godsavethequeen

SİZİN İÇİN HAZIRLADIĞIM ETİKET BULUTU ÖRNEKLERİ

Atatürk’ün Gençliğe Hitabesi
gencligehitabe

Deneyerek bulduğum ve hoşunuza gidecek güzel etiket bulutlarını bu kısma eklemeyi sürdürmeyi planlıyorum. Böylece bu yazı dinamik kalacak.

TÜRKÇE STANDART ETİKET BULUTU KULLANALIM KAMPANYASI

http://www.gunesintamicinde.com/turkce-icin-standart-tag-etiket-kumesi/

ETİKET BULUTLU MANŞETTEN HABER

346370107_33b16360dc
Görsel:urbanwild | Creative Commons lisansı ile kullanılmıştır.

Dergi kapağı – etiket bulutlu
107645200_5e6633dfff
http://www.flickr.com/photos/mansszat/107645200/

RESTAURANT VE ETİKET BULUTLU MÖNÜSÜ

223621227_c5463f7c3c
Görsel:random0 | Creative Commons lisansı ile kullanılmıştır.

ETİKET BULUTU YAPAN SİTELER

Etiket Bulutu Çeşitleri

http://www.smashingmagazine.com/2007/11/07/tag-clouds-gallery-examples-and-good-practices/

ETİKET BULUTU ANALİZİ PROFESYONEL ÜRÜN
http://www.zoomerang.com/feature-tag-clouds/
(Makalenin yazarı bu ürünü denememiştir öneri amacıyla değil bilgi amacıyla sunmaktadır.)

SON SÖZ

Etiket bulutu analizinin bir tek eksiği var. Özellikle Türkçe gibi sondan eklemeli dillerde bir kelimeye ek geldiğinde her ekli kelimeyi farklı sözcük kabul edip ayrı ayrı sayıyor. Böylece analizlerde sorunlar olabiliyor. İngilizce içinse fiilin zamana bağlı değişimleri bu hataya neden oluyor.

Bir de anlamdaş olan ama farklı yazılan kelimeler bulutta ayrı ayrı gösteriliyor. Bu seçenek yazının karakteriğini anlamamız için ışık tutabilirdi. Bunları yapabilmek için güçlü bir kelimelerin kökeni bilgisine sahip etiket bulutu analiz programına ihtiyacımız var. Özellikle Türkçe için.

Kaynakça:
http://en.wikipedia.org/wiki/Tag_cloud
http://www.joelamantia.com/tag-clouds/text-clouds-a-new-form-of-tag-cloud
http://www.webbyawards.com/press/archived-speeches.php
http://flamenco.berkeley.edu/papers/tagclouds.pdf
http://en.wikipedia.org/wiki/Folksonomy
http://www.metaportaldermedienpolemik.net/blog/RhNav/Text%20Mining
http://www.informaworld.com/smpp/content~db=all~content=a906001732
http://arxiv.org/abs/cs/0703109
http://www.epistemographer.com/2007/01/25/tag-cloud-of-my-book/
http://arxiv.org/abs/0710.2156
http://www.softwaremastercenter.com/free-tag-cloud-generator-script.html
http://www.lotsofcode.com/php/tag-cloud-v2.htm

Güneşin Tam İçinde



EPOSTA ABONELİĞİ İÇİN

Aşağıdaki formda e-posta adresinizi yazın, gelen e-postaya onay verin.


https://suleymansonmez.substack.com/
E-posta aboneliği için e-posta adresinizi eklemeniz, aşağıdaki konuları anlayıp izin verdiğiniz anlamına gelir.
Lütfen okuyunuz. Temel olarak, siteden (Güneşin Tam İçinde) ve yazardan (Süleyman Sönmez) e-posta bülten almaya izin vermek anlamını taşır. Bu iznin temeli: okunacak yazılar, izlenecek videolar, dinlenecek podcastlar, fotoğraflar, tanıtılacak ürün, kitap, site, uygulama, yapay zeka, eğitim, gezi, teknoloji, anket gibi içerikler ve kampanyalar olabilir. Bültenin içeriğinde, bülten sponsorunun ürün ve hizmetine ait bilgi, link ve banner yer alabilir. Bülten e-posta sistemi substack isimli dünyaca çok bilinen, güvenilir e-posta sistemi tarafından gönderilir. E-postalar yeni bir e-posta dağıtım sistemine geçmek dışında üçüncü şahıs ve şirketlerle paylaşılmaz. İşleyiş gereği yurtiçi ve yurtdışındaki server sistemlerinden hizmet verilebilir. Spam gönderilmez. İstediğiniz noktada, tek adımla her e-postanın en altındaki "Unsubscribe" seçilerek üyelikten çıkılır ve siz tekrar e-posta abonelik formuyla veya bülten sayfasında üye olana dek yeni e-posta almazsınız. İlginiz için teşekkür ederiz.


3 YORUMLAR

  1. Aynen Sinan D. gibi düşünüyorum. Metinde sık geçen sözcükler elbette önemli bir fikir verebilir ama kesinlikle metnin “anahtar sözcükler”i yerine geçmez. Buna karşılık, bir yazarın sözcük dünyasını ve o sözcük dağarcığında saklı “zihin haritası”nı okumak için de sizin verdiğiniz örnekler çok işe yarar. Metnin sözcük kümelenmesi, dilin ve zihnin nerelerde kümelendiğinin de iyi bir göstergesi olacaktır çünkü. Her zamanki gibi emeğinize sağlık. (Ben wordle.net’i kullanıp yazarlarla ilgili bir çalışma denemiştim.)

  2. Wordle’da şöyle bir problem var sanırım, blogun sadece ilk sayfasında gösterilen yazılarda geçen kelimeleri alıp analiz yapıyor.

    Tagul bu açıdan daha iyi gibi görünse de o da en popüler ilk 300 kelimeyi seçerek analiz yapıyor.. Yani bir URL’de kullanılan tüm kelimeler için kasmıyorlar.

SİZİN DÜŞÜNCENİZ NEDİR?

Yorumunuzu yazınız
İsminizi Yazınız