Szerkesztő:Gyimhu/Wikidata

A Wikipédiából, a szabad enciklopédiából

43 év tapasztalata alapján arra jutottam, hogy egy adatbázis-/alkalmazástervezőnek két alapvető dolgot kell nagyon jól tudnia:

  1. Különbséget tenni azonos és hasonló dolgok között. A kettőt ui. teljesen másképp kell implementálni. Az azonos dolgokat egy példányban tároljuk, a hasonlóakat pedig úgy, mintha teljesen különböznének. Egy egyszerű példa: hasonló, de különböző fogalom a regény és a könyv: egy könyvben több regény lehet, és egy regényt több könyv közölhet.[1]
  2. A jövőbe látni, hogy az adatokat milyen csoportosításban fogják lekérdezni az alkalmazások. A legtöbb esetben meg sem szabad próbálni az adatbázis szerkezetét a leendő alkalmazáshoz optimalizálni, hiszen a felhasználói igények hajmeresztőek tudnak lenni, és a másra optimalizált adatbázis nagyon rossz hatékonyságú.

A tapasztalataim szerint

  1. a magyar Wikipédiában senki nem tud megfelelően disztingválni
  2. fel sem merül az igény a felhasználás módjának figyelembe vételére.
Fenti felvetéseddel, leginkább az elsővel tökéletesen egyetértek.

Példák[szerkesztés]

Egy-egy példa mindkettőre.

Disztingválás[szerkesztés]

Szemantikai értelemben semmilyen különbség nincs egy szócikk szerzői és forrásai között. Mindkettő metaadat (és mindkettő összetett, de ez esetben ez mindegy). Aki ezt nem tudja, az jobb, ha nem próbálkozik adatbázistervezéssel.

A szemantikai azonosságon mit sem változtat, hogy a szerzőket táblában, a forrásokat szövegben tartjuk. A szemantika nem az adat formáján múlik (és jó esetben előbb dől el, mint a forma).

Nemrég azt javasoltam, hogy ha már a kettő azonos, kezeljük is ugyanúgy. Ha a más nyelvből fordított cikkeknél a szerzőket az eredeti wiki sorolja fel, miért kellene akkor a forrásokat átvenni?

A magyar wiki egyetlen informatikusa sem értette meg az azonosságot.

Az eredmény pedig a szokásos: a szerkesztők érzelmi alapon eldöntötték a kérdést. Ez a szellemi szint itt, a magyar Wikipédián. És a rosszabbnál rosszabb útmutatókat annyira sikerült a fejekbe döngölni, hogy már érzelmi reakciót vált ki, ha valamelyiket megkérdőjelezi az ember.

Ehhez nem kívánok hozzászólni! Hidd el meglehetősen nagy informatikai tapasztalatom van. Az első programom 1964-ben írtam. (Nem Magyarországon, itt akkor még nem volt számítógép) Tény, hogy egy relációs adatbázis és egy tristore között hatalmas filozófiai különbség van. A Wikipédia projekt a tristore mellett döntött ez van ezt nem tudod megváltoztatni meg kell tanulni használni.

Alkalmazástervezés[szerkesztés]

A magyar wikiszótár létezése önmagában bizonyíték az alkalmazás figyelembe nem vételére. Úgy hülyeség, ahogy van. A wikiszótár lényege az lenne, hogy egy helyen lehessen megtalálni egy szót a különböző nyelveken.

Nem állítom, hogy a wiki ideális alkalmazás egy szótár számára, de a magyar wikiszótár létrehozása ezen semmit nem segít, ellenben sokat ront.

A wikiszótárat szerintem globális adatbázisban kellene megcsinálni.

A magyar wiki önállósága[szerkesztés]

A wikidata használata előtt azt kellett volna eldönteni, hogy a magyar wiki önálló-e, vagy a világszerte egységes (gyakorlatilag: az angol) wiki magyar fordítása. E döntés hiánya nemcsak a wikidata használatakor, hanem egyébként is önellentmondásokat okoz a magyar wiki útmutatóiban. Megint a különbség és az azonosság kérdésénél vagyunk.

  1. Ha a magyar wiki önálló, akkor ugye az angol is az, vagyis az angol wiki lehet forrása a magyar wiki szócikkének.[2] Fordításkor pedig a forrás eleve az eredeti szócikk, bár ezt a magyar wikipédia szerkesztői képtelenek megérteni.[3]
  2. Ha a magyar wiki nem önálló, csak fordítás, akkor semmi nem indokol bármiféle korlátozást más wikire hivatkozásra. (Egy szoros, érzelmi alapon hozott döntés szerint már nincs is ilyen korlát, bár néhány admin még mindig szórakozik velem, ha élni akarok a lehetőséggel.)

Wikidata[szerkesztés]

A szócikkek nyilvántartására jó a globális adatbázis (nyelvközi hivatkozások), a metaadatoknál nem mindig, mert sokkal nehezebb és több wikipédiát is érint egy-egy vitás adat helyes értékének tisztázása. A legtöbb vita abból van, hogy magyar vonatkozású adatokat akarnak nem magyarok jobban tudni. Vagyis szerintem ahol mi vagyunk az adat gazdái, ott ne használjuk a wikidatát metaadatokra.

Miután a wikidatát jelenlegi állapotában metaadat-szintű felhasználásra alkalmatlannak tartom, nem is foglalkozom vele, így lehet, hogy az alábbiakban tévedek:

  1. nem lehet kívülről (nem wikipédiából) vagy nem regisztrált (saját) wikiből lekérdezni a wikidata adatait
  2. szócikkből nem lehet más szócikk wikidata-adatát lekérdezni :Le lehet. Kétségtelen programozni kell hozzá segítségül lásd pl. ezt: Modul:Határos
@Texaner: Ugye viccelsz? Miért kellene programoznia valakinek, aki szócikket ír? Vagy csak a programozó számít, a felhasználó nem?
Nem, nem viccelek. Természetesen ahhoz, hogy cikket írj/szerkessz nem kel programozni tudnod. Ha viszont a cikkíráson túlmenően sablont, vagy hozzá hasonló nem egyszerű hivatkozást szeretnél akkor keresni kell olyan társat aki ebben tud neked segíteni. (Mondjuk ez a magyar Wikipédiában valóban nem egyszerű.) Texaner vita 2018. november 18., 13:00 (CET)
  1. egy világszinten egységes adatbázisban nem lehet megengedni, hogy bárki megváltoztasson egy adatot úgy, hogy nem törődik az arra hivatkozó, különböző nyelvű szócikkekkel. Azt pedig senkitől nem lehet elvárni, hogy minden nyelven értsen annyit, hogy ellenőrizni tudja a változtatás hatását. :Ez sajnos a Wikipédia alapelvének a következménye. Mármint az, hogy elvben a Wikipédia minden projektjét bárki szerkesztheti.
@Texaner: Csakhogy a wikidatában ez az alapelv nem tartható. Akik a projektet csinálták, csak a programozási szempontokkal foglalkoztak, a használhatósággal nem.
Amennyire a wikipédiákban nyögvenyelős ugyan annyira a wikidatában is az, de ugyan úgy működik ez az alapelv. Egyébként a Wikidata használhatósága minden várakozást felülmúlóan jó ahogy ezt újságírók és tudományos kutatók egyre többen visszaigazolják. Hogy megértsd mire való valójában a Wikidata nézz meg pár mintalekérdezést itt: mintalekérdezések vagy látogass el a Resonator honlapjára Resonator és fenn, jobbra a keresőbe írj be valakit, vagy valamit ami érdekel. Texaner vita 2018. november 18., 13:14 (CET)

Egy enciklopédiától elvárnánk, hogy ugyanannak az adatnak mindig ugyanaz legyen az értéke. Ez pedig csak úgy lehetséges, ha az adat egy példányban van meg.[4] Ha pl. egy szócikkben összehasonlítom három sav pH-értékét,

Sav pH
sósav ennyi
kénsav annyi
salétromsav amannyi

akkor elvárható lenne, hogy a három sav pH-értéke ugyanonnan jöjjön a táblázatban és a három savról szóló szócikk infoboxában. Meg mindenütt, ahol valamelyik szócikk említi.

Az adatok egy helyen tárolására a wikipédia szoftver technikailag alkalmatlan.[5] Ehhez az kellene, hogy a szócikkek szövegében kötelező legyen az előre definiált metaadatokat használni. A wikidata lehetne a metaadatok forrása, de egyelőre ettől nagyon messze van.

A jelek szerint a wikidatában meg sem célozták, hogy bármely szócikk bármely wikidata-beli adatra hivatkozhassék, márpedig ez olyan mértékben befolyásolja a megvalósítást, hogy utólag nem is lehet majd megcsinálni.[6] Pedig azokon segítene, akik önként veszik a wikidatából a pH-értékeket, bár azon nem, hogy a wikipédia különböző helyein ezek az értékek különbözhetnek.

  1. Le lehet. Kellő számú API áll rendelkezésre a Wikipédia a LUA-t preferálja de gyakorlatilag bármilyen programnyelv számításba jöhet.
  2. Le lehet. Kétségtelen programozni kell hozzá segítségül lásd pl. ezt: Modul:Határos
  3. Ez sajnos a Wikipédia alapelvének a következménye. Mármint az, hogy elvben a Wikipédia minden projektjét bárki szerkesztheti. Texaner vita 2018. november 10., 22:09 (CET)

Kétségtelen tény, hogy a Wikidata használata bizony programozói ismereteket igényel. Főleg ha olyan mértékben szofisztikátlan akarja használni valaki mint te

Jegyzetek[szerkesztés]

  1. A könyvtári szoftverek tudnak különbséget tenni, de a könyvtárosok nem. Ennek az a következménye, hogy ugyanazt a könyvet meg lehet találni néha több példányban, néha meg egymástól független könyvként. Néha meg ezek kombinációjaként. Ez nem könnyíti meg a könyvek megtalálását.
  2. Egy szerkesző persze nem lehet önmaga forrása, vagyis a fenti szabály alól kivétel az a gyakorlatban sajnos elő nem forduló eset, amikor valaki két wikiben ír szócikket. Meg persze az is, ha az angol wikiben sincs forrás.
  3. Pedig könyvben is így van: a belső borítón feltüntetik a fordításhoz használt kiadást és a fordítót, a könyv pedig az eredeti szerző neve alatt fut.
  4. Ha valakinek van egy órája, tudja, mennyi a pontos idő. Ha kettő van neki, nem tudja.
  5. Elvileg meg lehetne csinálni, hogy minden metaadatra sablonból hivatkozunk, de ez gyakorlatilag lehetetlenné tenné mind a cikkírást, mind a sablonok karbantartását.
  6. Gondoljunk pl. arra az esetre, amikor a táblázat oszlopai sablonhívás eredményei, és változik a sablon. Bár ez a fenti példában nem életszerű, legfeljebb hibajavításkor fordul elő, ha valaki összekeverte a savakat, a tervezőnek viszont az elvileg lehetséges, gyakorlatilag lehetetlen esetekre is gondolnia kell.