Kullanıcı:Evrifaessa Bot/Kaynak düzeltme

Önemli not: Bot şu an için güvenlik sebebiyle sadece aşağıdaki listede bulunan alan adlarına ait kaynaklara başlık ekliyor. Bu siteler dışındaki sitelerin bazıları "casino" reklamı vs. içerdiğinden veya satıldığından/devredildiğinden Vikipedi'nin spam başlıklarla dolmaması için bu önlemi aldım. Bildiğiniz güvenilir haber siteleri/web siteleri varsa lütfen aşağıdaki listeye ekleyiniz. Sevgiler.--evrifaessa ❯❯❯ mesaj 07.54, 30 Haziran 2020 (UTC)

Evrifaessa Bot'un kaynak düzeltme fonksiyonu ne işe yarar? değiştir

Evrifaessa Bot, Evrifaessa'nın önderliğinde kaynaklardaki düz, başlıksız dış bağlantılara otomatik olarak ilgili bağlantının başlığını çekerek başlık ekliyor.

Örnek olarak birkaç değişiklik: [2], [3], [4] ve katkılarından daha çok örnek görebilirsiniz.

Uygulama değiştir

Bu şekildeki kaynaklar:

  • <ref>[https://www.sozcu.com.tr/2020/teknoloji/vikipedi-nedir-wikipedia-acildi-mi-5568457/]</ref>[1]
  • <ref>https://www.sozcu.com.tr/2020/teknoloji/vikipedi-nedir-wikipedia-acildi-mi-5568457/</ref>[2]

Bunlara çevriliyor:

  • <ref>{{Haber kaynağı <!-- Bot tarafından otomatik başlık oluşturuldu --> |başlık=Vikipedi nedir? Wikipedia açıldı mı? |url=https://www.sozcu.com.tr/2020/teknoloji/vikipedi-nedir-wikipedia-acildi-mi-5568457/ |yayıncı=[[Sözcü (gazete)|Sözcü]] |erişimtarihi=24 Haziran 2020}}</ref>[3]

Sonuç olarak bu şekilde gözüküyorlar:

  1. ^ [1]
  2. ^ https://www.sozcu.com.tr/2020/teknoloji/vikipedi-nedir-wikipedia-acildi-mi-5568457/
  3. ^ "Vikipedi nedir? Wikipedia açıldı mı?". Sözcü. Erişim tarihi: 24 Haziran 2020. 
  • URL başlığı olarak kullanılan başlık, ilgili sayfadaki HTML başlığıdır. (<title> etiketinden çekilir)
  • Yeni satırlar, uzun başlıklardan kaçınmak için tek bir boşluğa dönüştürülür. Fazladan boşluklar da kaldırılır.
  • content-type text/html değilse (medya dosyaları, .doc, vs.), Başlığı otomatik olarak bulamıyorum, bu nedenle yalnızca referansları <ref>http://lien.org/doc.pdf</ref> şekline çeviriyorum.
  • Uzun başlıkları 250 karaktere kısıtlıyorum. Bir başlık 250 karakteri geçerse başlığı "..." şeklinde bitiriyorum.

Özellikler değiştir

  • PDF dosyalarından başlık okuma (Geçici olarak devre dışı)
  • Kırık/ölü bağlantı bulunduğunda {{ölü bağlantı}} yerleştirme
  • İkiz referans (aynı içeriğe sahip olan ayrı referanslar) bulduğumda sadece ilkini tutuyor, diğerlerine refname koyuyorum.
  • Sitenin haber sitesi olup olmadığını ayırt edip uygun kaynak gösterme şablonunu kullanma
  • Erişim tarihi ekleme

Hey, bazı bağlantıları unuttun! değiştir

Evrifaessa Bot çalıştırıldıktan sonra bile bazı bağlantılar değiştirilemeyebilir. Sebebi bunlardan biri olabilir :

  • HTML sayfasının başlığı olmayabilir (sık karşılaşılmaz, ama olabilir)
  • Evrifaessa Bot sayfaya erişmeye çalıştığında hata almış olabilir.
  • Link ya da başlık karalisteye alınmış olabilir.

Karaliste ve önlemler değiştir

  • Bağlantılar : Eğer bir bağlantının karalisteye alınmasını gerektiğini düşünüyorsanız beni dürtün ya da direkt olarak aşağıdaki listeyi değiştirin. Şu an için aşağıdaki alan adları karalistededir :
  • "kimkimdir.gen.tr" (Başlıkları spam gibi, değişik karakterler içeriyor)
  • "jstor.org"
  • "investigate911.com" (Satılmış site, spam)
  • YouTube, Dailymotion, Vimeo, İzlesene (ileride video kaynağı şablonuyla entegre edeceğimden şimdilik ellemiyorum)
  • "dergipark.com.tr" (@Dr. Coal'ın ricası üzerine bu sitede {{Dergi kaynağı}} kullanacağım; ama o zamana kadar kara listede dursun, bot web kaynağı şablonu eklemesin daha iyi.)
  • Başlıklar : "kaydol", "giriş yap", "404 not found" gibi başlıkları gördüğünde bot bu başlıkları kullanmaz.
  • Kırık, yanıt vermeyen sayfalar : Örnek olarak Türkçe için .*(sayfa|site|siteye).*(bulunamadı|ulaşılamıyor|yanıt vermiyor|ulaşılamadı).* düzenli ifadesiyle bot Türkçe dahil olmak üzere 6 dilde (en, fr, es, it, ru, tr) hata mesajlarını algılıyor ve eğer başlıklarda bu gibi ifadeler geçiyorsa o başlığı maddedeki kaynağa eklemiyor.

Bilinen sorunlar/sorunlu siteler değiştir

  • haberturk.com.tr : Hiçbir sayfalarına charset bilgisi eklememişler. Önlem amaçlı eklediğim filtreye takılıyor sürekli, dolayısıyla habertürk linklerini şu an için önlem amaçlı okuyamam.

Evrifaessa Bot'un bir sayfayı özellikle kontrol etmesini nasıl sağlarım? değiştir

Sadece bekleyin. Bot ara sıra tüm Vikipedi'yi turlayacaktır. Eğer önemli bir maddeyse ya da maddedeki kaynakların çoğu düzensizse Evrifaessa'ya yazabilirsiniz.

Yayıncı parametresinin içeriği değiştir

Evrifaessa Bot, aşağıdaki listedeki alan adlarını kaynaktaki bağlantının alan adıyla karşılaştırarak uygun maddeyi kaynak şablonundaki "yayıncı" parametresine ekleyecektir. Bu siteler dışındaki sitelerde ise bu parametre bot tarafından boş bırakılacaktır. Siz de ekleme yaparak botun site tanımasını daha kararlı hale getirebilirsiniz. Katkılarınız için teşekkürler :)

Nasıl site eklerim? değiştir

  • Eğer ekleyeceğiniz site bir haber sitesiyse ve {{Haber kaynağı}} şablonunun kullanılması gerekiyorsa haberSiteleri kısmına, eğer web sitesiyse ve {{Web kaynağı}} şablonu kullanılması gerekiyorsa normalSiteler kısmına ekleyiniz. Burada olmayan sitelerle karşılaşılsa bile bot otomatik olarak kaynağı {{Web kaynağı}} şablonuna uygun olarak tekrar düzenleyecek ve parametreleri şablona dizecektir, tek fark "yayıncı" parametresinin boş olması olacaktır.

Liste değiştir

haberSiteleri = {
    'aa.com.tr': '[[Anadolu Ajansı]]',
    'ahaber.com.tr': '[[A Haber]]',
    'ajansspor.com': '[[Ajansspor]]',
    'aksam.com.tr': '[[Akşam (gazete)|Akşam]]',
    'aljazeera.com': '[[Al Jazeera]]',
    'aljazeera.com.tr': '[[Al Jazeera Türk]]',
    'aljazeera.net': '[[Al Jazeera]]',
    'aspor.com.tr': '[[A Spor]]',
    'aydinlik.com.tr': '[[Aydınlık (gazete)|Aydınlık Gazetesi]]',
    'bbc.co.uk': '[[BBC Online]]',
    'bbc.com': '[[BBC Online]]',
    'birgun.net': '[[BirGün]]',
    'bloomberght.com': '[[Bloomberg HT]]',
    'cnn.com': '[[CNN]]',
    'cnnturk.com': '[[CNN Türk]]',
    'cumhuriyet.com.tr': '[[Cumhuriyet (gazete)|Cumhuriyet]]',
    'dailysabah.com': '[[Daily Sabah]]',
    'dha.com.tr': '[[Demirören Haber Ajansı]]',
    'diken.com.tr': '[[Diken (gazete)|Diken]]',
    'donanimhaber.com': '[[Donanımhaber]]',
    'dunya.com': '[[Dünya (gazete)|Dünya]]',
    'dunyabulteni.net': '[[Dünya Bülteni]]',
    'english.aljazeera.net': '[[Al Jazeera English]]',
    'fanatik.com.tr': '[[Fanatik (gazete)|Fanatik]]',
    'forbes.com': '[[Forbes]]',
    'fotomac.com.tr': '[[Fotomaç]]',
    'haber7.com': '[[Haber7.com]]',
    'haberler.com': '[[Haberler.com]]',
    'haberturk.com': '[[Haberturk.com]]',
    'haberturk.tv': '[[Habertürk TV|Habertürk]]',
    'halktv.com.tr': '[[Halk TV]]',
    'huffingtonpost.com': '[[The Huffington Post]]',
    'hurriyet.com.tr': '[[Hürriyet (gazete)|Hürriyet]]',
    'iha.com.tr': '[[İhlas Haber Ajansı]]',
    'independent.co.uk': '[[The Independent]]',
    'medyascope.tv': '[[Medyascope]]',
    'medyatava.com': '[[Medyatava]]',
    'medyatava.net': '[[Medyatava]]',
    'milliyet.com.tr': '[[Milliyet (gazete)|Milliyet]]',
    'mirror.co.uk': '[[Daily Mirror]]',
    'news.bbc.co.uk': '[[BBC Online]]',
    'ntv.com.tr': '[[NTV]]',
    'ntvspor.net': '[[NTV Spor]]',
    'nytimes.com': '[[The New York Times]]',
    'odatv2.com': '[[OdaTV]]',
    'odatv3.com': '[[OdaTV]]',
    'odatv4.com': '[[OdaTV]]',
    'odatv5.com': '[[OdaTV]]',
    'odatv.com': '[[OdaTV]]',
    'radikal.com.tr': '[[Radikal (gazete)|Radikal]]',
    'reuters.com': '[[Reuters]]',
    'sabah.com.tr': '[[Sabah (gazete)|Sabah]]',
    'shiftdelete.net': '[[ShiftDelete]]',
    'sozcu.com.tr': '[[Sözcü (gazete)|Sözcü]]',
    'sporx.com': '[[Sporx]]',
    'tr.sputniknews.com': '[[Sputnik (haber ajansı)|Sputnik]]',
    'sputniknews.com': '[[Sputnik (haber ajansı)|Sputnik]]',
    'starkibris.net': '[[Star Kıbrıs]]',
    't24.com.tr': '[[T24]]',
    'takvim.com.tr': '[[Takvim (gazete)|Takvim]]',
    'techcrunch.com': '[[TechCrunch]]',
    'techradar.com': '[[TechRadar]]',
    'teknokulis.com': '[[Teknokulis]]',
    'telegraph.co.uk': '[[The Daily Telegraph]]',
    'tgrthaber.com.tr': '[[TGRT Haber]]',
    'theguardian.com': '[[The Guardian]]',
    'theverge.com': '[[The Verge]]',
    'trthaber.com': '[[TRT Haber]]',
    'turkgun.com': '[[Türkgün]]',
    'rt.com': '[[RT]]',
    'kibrispostasi.com': '[[Kıbrıs Postası (2001)|Kıbrıs Postası]]',
    'washingtonpost.com': '[[The Washington Post]]',
    'gazetevatan.com': '[[Vatan (gazete, 2002)|Vatan Gazetesi]]',
    'yeniakit.com.tr': '[[Yeni Akit]]',
    'yeniasir.com.tr': '[[Yeni Asır]]',
    'yeniduzen.com': '[[Yenidüzen]]',
    'yenisafak.com': '[[Yeni Şafak]]',
    'hurarsiv.hurriyet.com.tr': '[[Hürriyet (gazete)|Hürriyet Arşiv]]',
    'haber.sol.org.tr': '[[soL Haber Portalı]]',
    'sol.org.tr': '[[soL Haber Portalı]]',
    'xinhuanet.com': '[[Xinhua Tongxunshe]]',
    'ahvalnews.com': '[[Ahval]]',
    'bianet.org': '[[Bianet]]',
    'm.bianet.org': '[[Bianet]]',
    'haberglobal.com.tr': '[[Haber Global]]',
    'tele1.com.tr': '[[Tele1]]',
    'al-monitor.com': '[[Al-Monitor]]',
    'amerikaninsesi.com': '[[Amerika\'nın Sesi]]',
    'bbc.com/turkce': '[[BBC Türkçe]]',
    'dw.com': '[[Deutsche Welle]]',
    'gazeteduvar.com.tr': '[[Gazete Duvar]]',
    'hurriyetdailynews.com': '[[Hürriyet Daily News]]',
    'milligazete.com.tr': '[[Millî Gazete]]'
}

normalSiteler = {
    'sinemalar.com': '[[Sinemalar.com]]',
    'eksisozluk.com': '[[Ekşi Sözlük]]',
    'google.com': '[[Google]]',
    'google.com.tr': '[[Google]]',
    'facebook.com': '[[Facebook]]',
    'mynet.com': '[[Mynet]]',
    'en.wikipedia.org': '[[İngilizce Vikipedi]]',
    'de.wikipedia.org': '[[Almanca Vikipedi]]',
    'tr.wikipedia.org': '[[Türkçe Vikipedi]]',
    'fr.wikipedia.org': '[[Fransızca Vikipedi]]',
    'it.wikipedia.org': '[[İtalyanca Vikipedi]]',
    'twitter.com': '[[Twitter]]',
    'stackoverflow.com': '[[Stack Overflow]]',
    'ysk.gov.tr': '[[Yüksek Seçim Kurulu (Türkiye)|Yüksek Seçim Kurulu]]',
    'tff.org': '[[Türkiye Futbol Federasyonu]]',
    'tff.org.tr': '[[Türkiye Futbol Federasyonu]]',
    'uefa.com': '[[UEFA]]',
    'uefa.org': '[[UEFA]]',
    'tvf.org.tr': '[[Türkiye Voleybol Federasyonu]]',
    'icisleri.gov.tr': '[[Türkiye Cumhuriyeti İçişleri Bakanlığı]]',
    'ardahan.edu.tr': '[[Ardahan Üniversitesi]]',
    'tuik.gov.tr': '[[Türkiye İstatistik Kurumu]]',
    'arduino.cc': '[[Arduino]]',
    'showtv.com.tr': '[[Show TV]]',
    'imdb.com': '[[IMDb]]',
    'ktb.gov.tr': '[[Türkiye Cumhuriyeti Kültür ve Turizm Bakanlığı]]',
    'tbmm.gov.tr': '[[Türkiye Büyük Millet Meclisi]]',
    'fenerbahce.org': '[[Fenerbahçe SK]]',
    'galatasaray.org': '[[Galatasaray SK]]',
    'bjk.com.tr': '[[Beşiktaş JK]]',
    'trabzonspor.org.tr': '[[Trabzonspor]]',
    'ibfk.com.tr': '[[İstanbul Başakşehir FK]]',
    'ktff.net': '[[Kıbrıs Türk Futbol Federasyonu]]',
    'tccb.gov.tr': '[[Türkiye Cumhuriyeti Cumhurbaşkanlığı]]',
    'filmekimi.iksv.org': '[[Filmekimi]]',
    'fivb.org': '[[Uluslararası Voleybol Federasyonu]]',
    'fivb.com': '[[Uluslararası Voleybol Federasyonu]]',
    'cia.gov': '[[CIA]]',
    'iksv.org': '[[İstanbul Kültür Sanat Vakfı]]',
    'boxofficeturkiye.com': '[[Box Office Türkiye]]',
    'iafd.com': '[[Internet Adult Film Database]]',
    'nasa.gov': '[[NASA]]',
    'trustedreviews.com': '[[Trusted Reviews]]',
    'techradar.com': '[[TechRadar]]',
    'cnet.com': '[[CNET]]',
    'nationalgeographic.com': '[[National Geographic]]',
    'sky-map.org': '[[Sky-Map]]',
    'server6.sky-map.org': '[[Sky-Map]]',
    'whc.unesco.org': '[[UNESCO|UNESCO World Heritage Centre]]',
    'wikisky.org': '[[WikiSky]]',
    'scholar.google.com': '[[Google Scholar]]',
    'ncbi.nlm.nih.gov': '[[National Center for Biotechnology Information]]',
    'worldcat.org': '[[WorldCat]]',
    'billboard.com': '[[Billboard (dergi)|Billboard]]',
    'wwe.com': '[[WWE]]',
    'viaf.org': '[[Virtual International Authority File]]',
    'sinematurk.com': '[[SinemaTürk]]',
    'transfermarkt.com.tr': '[[Transfermarkt]]',
    'transfermarkt.com': '[[Transfermarkt]]',
    'transfermarkt.de': '[[Transfermarkt]]',
    'transfermarkt.com.br': '[[Transfermarkt]]',
    'transfermarkt.es': '[[Transfermarkt]]',
    'transfermarkt.nl': '[[Transfermarkt]]',
    'transfermarkt.co.uk': '[[Transfermarkt]]',
    'transfermarkt.us': '[[Transfermarkt]]',
    'transfermarkt.it': '[[Transfermarkt]]',
    'transfermarkt.pt': '[[Transfermarkt]]',
    'quickfacts.census.gov': '[[Amerika Birleşik Devletleri Nüfus Sayım Bürosu]]',
    'euroleague.net': '[[EuroLeague]]',
    'census.gov': '[[Amerika Birleşik Devletleri Nüfus Sayım Bürosu]]',
    'boxofficemojo.com': '[[Box Office Mojo]]',
    'rsssf.com': '[[RSSSF]]',
    'discogs.com': '[[Discogs]]',
    'nba.com': '[[National Basketball Association]]',
    'britannica.com': '[[Encyclopædia Britannica]]',
    'rottentomatoes.com': '[[Rotten Tomatoes]]',
    'biruni.tuik.gov.tr': '[[Türkiye İstatistik Kurumu]]',
    'resmigazete.gov.tr': '[[T.C. Resmî Gazete]]',
    'rollingstone.com': '[[Rolling Stone]]',
    'goal.com': '[[Goal.com]]',
    'metacritic.com': '[[Metacritic]]',
    'premierleague.com': '[[Premier League]]',
    'animenewsnetwork.com': '[[Anime News Network]]',
    'beyazperde.com': '[[Beyazperde (web sitesi)|Beyazperde]]',
    'tdk.gov.tr': '[[Türk Dil Kurumu]]',
    'tamindir.com': '[[Tamindir]]',
    'blog.tamindir.com': '[[Tamindir|Tamindir Blog]]',
    'wired.com': '[[Wired (dergi)|Wired]]',
    'developers.google.com': '[[Google Developers]]',
    'support.google.com': '[[Google|Google Support]]',
    'cloud.google.com': '[[Google Cloud]]',
    'tubitak.gov.tr': '[[TÜBİTAK]]'
}

Bir problem hakkında kimi aşağılamalıyım bilgilendirmeliyim? değiştir