Etiket bulutları bir yazı içinde geçen kelimelerin sık tekrarlananlarını seçen, bunları şematik bir düzende bir araya getirip en çok kullanılanları daha büyük gösteren bir tekniktir. Bu teknikle, pek çok sitenin, romanın, tezin, ifadenin ve yazının temeli ve vurguladığı anlamlar analiz edilebilir. Gelin, bu işi yapan online servisleri ve yaptığım örnekleri gezelim
Güneşin Tam İçinde anasayfa/homepage etiket bulutu – Wordle kullanılmıştır
KELİME BULUTU NASIL YAPILIR?
ETİKET BULUTLARINI (TAG CLOUDS)
NASIL HAZIRLIYORUZ?
Bu analizlerde kullandığım iki site var:
Wordle.net ve Tagul.com
Wordle.net kullanımı basit bir site. http://www.wordle.net/create adresine girip elinizdeki metni yapıştırmanız ya da alttaki kutuya istediğiniz web sitesinin rss adresini vermeniz yetiyor. (Wordle’ın çalışabilmesi için çoğu bilgisayarda yüklü olan JAVA bilgisayarınızda yüklü olmalı. Eğer sitesinde yüklemenizi istiyorsa, çekinmeden yükleyebilirsiniz. Elle kendiniz yüklemek isterseniz www.java.com)
Tagul ise daha profesyonel bir yaklaşım gösteriyor. Oluşan etiket bulutu o sitede aramalarda kullanılabiliyor ve JAVA yerine Flash sistemini kullanarak daha çok kişiye ulaşıyor. Siteye “sign up” ile üye olunuyor. Üye olduktan sonra “Sign in” ile giriş yapılıyor. Bir kaç adımda istenen site adresi verilip etiketleri bul (Fetch the tags) deniyor. Ardından yazıtipi ve stili seçiliyor. Ben Türkçe harfleri düzgün göstermesi için birkaç yazıtipi denedikten sonra belirledim. Tagul’da en çok uğraştıran ise bu etiket bulutunda anahtar kelimeye tıklanınca ilgili sitenin içinde aratmaktı. Bunun için googleın site içi arama URLsini aldım ve bunu tagul’un verdiği $tag ile birleştirdim. (http://www.google.com/search?hl=tr&q=site%3Awww.milliyet.com.tr++$tag) şeklinde. Bu örnekte elbette www.milliyet.com.tr yerine sizin üzerinde çalıştığınız web adresi gelmeli.
Teknik detayı uzatmıyorum. Analizlere geçelim.
ANALİZ1) WEB SİTELERİ ZİYARETÇİLERE ASLINDA NE ANLATIYOR?
Türkiye’nin en çok ziyaret edilen sitelerini saptamak için genellikle Alexa verilerini kullanıyoruz. Gerçi Alexa verileri %100 doğruluk sağlamaz ama gerçeğe en yakın sektör analizleri ve karşılaştırmalı site analizleri burada yapılır. Türkiye için en çok ziyaret edilen web siteleri Alexa listesi de şurada: http://www.alexa.com/topsites/countries/TR
MİLLİYET GAZETESİ WEB SİTESİ
Bir örnek sunarsam tümünü yapmaya gerek kalmadan işin ruhunu görmüş olacaksınız. Aşağıda www.milliyet.com.tr için Tagul ve Wordle ile yaptığım örnekleri görüyorsunuz. Bir gazetenin haberleri sürekli değişeceği için bu etiket bulutu hergün yeniden oluşturulmalıdır.
WORDLE – Milliyet – http://www.milliyet.com.tr
TAGUL – Milliyet – http://www.milliyet.com.tr
ANALİZ 2) POLİTİKACILAR ASLINDA NE DİYORLAR?
AMERİKAN BAŞKANLARININ ETİKET BULUTLARI
Obama’nın Konuşması
Bu adreste çok ilginç bir analiz var. ABD devlet başkanlarının (bu örnekte Obama, Bush, Clinton, Reagan, Lincoln ele alınmış) göreve gelişleri ile ulusa sesleniş konuşması yapmaları bir gelenek. Bu konuşmalar, etiket bulutu analizinden geçirildiğinde mesajlarda bazı kelimeler müthiş öne çıkıyor. Sanki bu kelimelerin karşıladığı anlamları temin edeceklerine dair güvence vermek istemişler.
Bush’un konuşması – Beklendiği gibi terörizm, Irak ve özgürlük getirmek üzerine kurulu. Yorum yapmayacağım. Olan bitenleri hepimiz gördük.
Bu çeşit bir çalışma ülkemiz Başbakanları ve Cumhurbaşkanları için yapıldı mı bilmiyorum? Yapılmadıysa sosyal alanlarda akademik çalışma yapan bir akademisyen için bence ilginç bir tez konusu olacaktır. Ayrıca önemli kişilerin önemli konuşmalarının listesi şurada arşivlenmiş ki incelemek isteyenler için harika bir kaynak. Şu sitede de Bill Gates’in bir konuşması etiket bulutu haline getirilmiş.
Martin Luther King, Jr. | “I Have a Dream” konuşmasının etiket bulutunu oluşturduğumda beklediğim gibi Freedom / özgürlük kelimesi birinci geldi. Bu konuşmayı zenci vatandaşların hakları için yapmıştı ve negro kelimesini rahatça kullanmıştı. Bugün “Afrika kökenli Amerikalı”dan başka bir tanımlama kelimesi kullanmanız doğrudan hakaret sayılıyor.
ANALİZ 3) HABER SİTELERİNDE EN ÇOK ARANAN KELİMELER GÜNDEME IŞIK TUTAR
http://www.nytimes.com/gst/mostsearched.html?format=tagcloud&period=1
The New York Times’ın bu sayfasında sitede en çok aranan kelimelerden oluşan etiket bulutunu görüyoruz. Bu elbette gündemin ne olduğunu bize açıkca gösteriyor. Son 24 saat, 7 gün 30 gün gibi seçenekler var. (Size küçük ödevcik: Türkçe haber sitelerinde bu özellik var mı? Varsa etiket olarak sunuyorlar mı?)
ANALİZ 4) KİTAPLARIN ETİKETİ, ÖZETLERİNDEN ETKİLİDİR
KLASİK ROMANLARIN ETİKET BULUTLARINI YAPMAK
“Fikir çok güzel ama kitapların yazılı metinlerini nereden bulacağız?” diyorsanız, dünya genelinde basıldıktan sonra 70 sene geçen eserlerin telif hakları bitiyor. Böylece Gutenberg projesinde yerlerini alıyorlar. İstenilen bir kitap yasal şekilde aratılıp içinde analiz yapılabilir.
Gutenberg Projesi : http://www.gutenberg.org/ En çok indirilen kitap listesini de taramak isteyebilirsiniz.
Örneğin sizin için ALICE’S ADVENTURES IN WONDERLAND (Alice Harikalar Diyarı’nda) kitabını aratıp düzyazı .txt formatında görüntülettim.
http://www.gutenberg.org/files/11/11.txt
Bu sayfayı Wordle.net’te etiket bulutuna dönüştürdüğümde çıkan sonuç aşağıda
(İlk kutuya romanın tamamını yapıştırırken, Gutenberg projesinin sayfanın başına ve sonuna eklediği yasal uyarı metinlerini silmeye dikkat etmelisiniz)
Annabel Lee çok güzel bir şiirdir. Şair: Edgar Allan POE
Annabel Lee (Türkçe) Şair: Edgar Allan POE Çeviren : Melih Cevdet ANDAY
Ulysses James Joyce tarafından yazılmış efsane kitaptır. Orijinal dilindeki etiket bulutunu aşağıda oluşturdum.
Küçük Prens (Le Petit Prince) için etiket bulutu aşağıda.
ANALİZ 5) YASANIN RUHU
ANAYASALARIN ETİKET BULUTLARINI YAPMAK
Aklıma 1982 anayasasını etiket bulutu ile görmek geldi. Aşağıdaki tabloyu bozan tek kelime Madde kelimesi bence. Anasayadaki her bir kavram için ayrı madde kelimesi geçtiğinden en çok tekrar eden kelime o oluyor. Madde kelimesini çıkarmayı düşündüm. Metnin tamamından çıkarınca tablo değişecekti. Fakat sürekli madde denilmiş olması bile bence anlam taşıyor. Bu nedenle müdahale etmedim. Aşağıda anayasamızın tam metninden oluşan etiket bulutu görülüyor.
Türkiye Cumhuriyeti 1982 Anayasası – http://www.tbmm.gov.tr/anayasa.htm
United States Declaration of Independence | Amerikan Bağımsızlık Bildirgesi
Türkçe – Amerikan Bağımsızlık Bildirgesi
ANALİZ 5) MİLLİ MARŞLARIN SÖZLERİ
İSTİKLAL MARŞI GİBİ DİĞER ÜLKELERİN MARŞLARI HANGİ YÜKSEK ÜLKÜLERİ SAVUNUYOR?
Türkiye – İstiklal Marşı (10 kıtası)
God Save the Queen | Birleşik Krallık Ulusal Marşı
SİZİN İÇİN HAZIRLADIĞIM ETİKET BULUTU ÖRNEKLERİ
Atatürk’ün Gençliğe Hitabesi –
Deneyerek bulduğum ve hoşunuza gidecek güzel etiket bulutlarını bu kısma eklemeyi sürdürmeyi planlıyorum. Böylece bu yazı dinamik kalacak.
TÜRKÇE STANDART ETİKET BULUTU KULLANALIM KAMPANYASI
http://www.gunesintamicinde.com/turkce-icin-standart-tag-etiket-kumesi/
ETİKET BULUTLU MANŞETTEN HABER
Görsel:urbanwild | Creative Commons lisansı ile kullanılmıştır.
Dergi kapağı – etiket bulutlu
http://www.flickr.com/photos/mansszat/107645200/
RESTAURANT VE ETİKET BULUTLU MÖNÜSÜ
Görsel:random0 | Creative Commons lisansı ile kullanılmıştır.
ETİKET BULUTU YAPAN SİTELER
- Wordle
- Tagul
- Google Tag Cloud Maker
- TagCrowd
- Tag Cloud (Flashlı ve 3d Etiket Bulutu oluşturur)
- Text Tagcloud
- Tag Cloud Generator
- MakeCloud
- Winkwaves Tag Cloud Generator
- Tag Cloud Builder
- ZoomClouds
Etiket Bulutu Çeşitleri
http://www.smashingmagazine.com/2007/11/07/tag-clouds-gallery-examples-and-good-practices/
ETİKET BULUTU ANALİZİ PROFESYONEL ÜRÜN
http://www.zoomerang.com/feature-tag-clouds/
(Makalenin yazarı bu ürünü denememiştir öneri amacıyla değil bilgi amacıyla sunmaktadır.)
SON SÖZ
Etiket bulutu analizinin bir tek eksiği var. Özellikle Türkçe gibi sondan eklemeli dillerde bir kelimeye ek geldiğinde her ekli kelimeyi farklı sözcük kabul edip ayrı ayrı sayıyor. Böylece analizlerde sorunlar olabiliyor. İngilizce içinse fiilin zamana bağlı değişimleri bu hataya neden oluyor.
Bir de anlamdaş olan ama farklı yazılan kelimeler bulutta ayrı ayrı gösteriliyor. Bu seçenek yazının karakteriğini anlamamız için ışık tutabilirdi. Bunları yapabilmek için güçlü bir kelimelerin kökeni bilgisine sahip etiket bulutu analiz programına ihtiyacımız var. Özellikle Türkçe için.
Kaynakça:
http://en.wikipedia.org/wiki/Tag_cloud
http://www.joelamantia.com/tag-clouds/text-clouds-a-new-form-of-tag-cloud
http://www.webbyawards.com/press/archived-speeches.php
http://flamenco.berkeley.edu/papers/tagclouds.pdf
http://en.wikipedia.org/wiki/Folksonomy
http://www.metaportaldermedienpolemik.net/blog/RhNav/Text%20Mining
http://www.informaworld.com/smpp/content~db=all~content=a906001732
http://arxiv.org/abs/cs/0703109
http://www.epistemographer.com/2007/01/25/tag-cloud-of-my-book/
http://arxiv.org/abs/0710.2156
http://www.softwaremastercenter.com/free-tag-cloud-generator-script.html
http://www.lotsofcode.com/php/tag-cloud-v2.htm
Güneşin Tam İçinde
EPOSTA ABONELİĞİ İÇİN
Aşağıdaki formda e-posta adresinizi yazın, gelen e-postaya onay verin.E-posta aboneliği için e-posta adresinizi eklemeniz, aşağıdaki konuları anlayıp izin verdiğiniz anlamına gelir.
Lütfen okuyunuz. Temel olarak, siteden (Güneşin Tam İçinde) ve yazardan (Süleyman Sönmez) e-posta bülten almaya izin vermek anlamını taşır. Bu iznin temeli: okunacak yazılar, izlenecek videolar, dinlenecek podcastlar, fotoğraflar, tanıtılacak ürün, kitap, site, uygulama, yapay zeka, eğitim, gezi, teknoloji, anket gibi içerikler ve kampanyalar olabilir. Bültenin içeriğinde, bülten sponsorunun ürün ve hizmetine ait bilgi, link ve banner yer alabilir. Bülten e-posta sistemi substack isimli dünyaca çok bilinen, güvenilir e-posta sistemi tarafından gönderilir. E-postalar yeni bir e-posta dağıtım sistemine geçmek dışında üçüncü şahıs ve şirketlerle paylaşılmaz. İşleyiş gereği yurtiçi ve yurtdışındaki server sistemlerinden hizmet verilebilir. Spam gönderilmez. İstediğiniz noktada, tek adımla her e-postanın en altındaki "Unsubscribe" seçilerek üyelikten çıkılır ve siz tekrar e-posta abonelik formuyla veya bülten sayfasında üye olana dek yeni e-posta almazsınız. İlginiz için teşekkür ederiz.
Aynen Sinan D. gibi düşünüyorum. Metinde sık geçen sözcükler elbette önemli bir fikir verebilir ama kesinlikle metnin “anahtar sözcükler”i yerine geçmez. Buna karşılık, bir yazarın sözcük dünyasını ve o sözcük dağarcığında saklı “zihin haritası”nı okumak için de sizin verdiğiniz örnekler çok işe yarar. Metnin sözcük kümelenmesi, dilin ve zihnin nerelerde kümelendiğinin de iyi bir göstergesi olacaktır çünkü. Her zamanki gibi emeğinize sağlık. (Ben wordle.net’i kullanıp yazarlarla ilgili bir çalışma denemiştim.)
Müsadenizle yazınız için şunu belirteyim: Tek kelime
Mükemmel
Wordle’da şöyle bir problem var sanırım, blogun sadece ilk sayfasında gösterilen yazılarda geçen kelimeleri alıp analiz yapıyor.
Tagul bu açıdan daha iyi gibi görünse de o da en popüler ilk 300 kelimeyi seçerek analiz yapıyor.. Yani bir URL’de kullanılan tüm kelimeler için kasmıyorlar.