Tillbaka Mina planer för Paranormal.se

Det jag vill göra bygger på mina idéer och den erfarenhet och de program jag har från Inormation Highway Göteborg, paranormal.se, SKIP och de komponenter jag utvecklat under tiden. En del av det (interna) pågående arbetet ligger under wraf.para.se.

Alla sidor har (nästan helt) konverterats till XML. Anledningen är att jag vill automatisera hanteringen av webbsidorna. Med XML blir det enklare att skriva program som läser in en webbsida i en trädstruktur, uppdaterar / tar bort / lägger till någon del i sidan, och skriver ut den uppdaterade webbsidan. En webbsida kan vara långt mer komplex än vad som går att representera med en vanlig databas. Exempelvis kan en bekrivning av en bok innehålla mängder av referenser till författare, förlag, ämnen, kommentarer, osv. Var och en av dessa kan ha ytterligare info kopplad till sig som i sin tur kan ha egna kopplingar och referenser. XML är skapad för att representera sådana komplexa datastrukturer.

Syfte

Jag vill skapa ett hypertextlexikon. Varje sida behandlar ett ämne. Alla följdfrågot och undringar en läsare kan få från sidans ämne ska besvaras av länkar från sidan, på den plats där frågan uppstår. Exempelvis kan förekommande facktermer i en text länkas till en sida som förklarar dem och begrepp i texten länkas till sidor som behandlar begreppen. I en akademisk text förekommer ofta referenser både till andra texter och inom texten. Även dessa skulle kunna vara hypertextlänkar. I ett lexikon brukar ord i texten med fet stil ange att dessa ord kan slås upp. Där förekommer också ett antal "Se också" som pekar till uppslagsord där man kan läsa mer om ämnet, ur andra perspektiv.

Målet är att skapa en miljö för kunskapsuppbyggande. Vilket ämne som väljs spelar ingen större roll. Men det är en fördel att inte ha ett alltför stort område.

Problem

Problemet med många ansamlingar av dokument är att ju fler som tillkommer, desto mer oöverskådligt blir det. Innehållet i många dokument överlappar varandra. Vill man få all information om ett område blir man då tvungen att ta alla dessa dokument i beaktande genom att plöja igenom dem och läsa mer eller mindre samma sak om och om igen, för att hitta det som är unikt i varje ny avhandling i samma ämne.

Så hur skapar man en miljö där mer och mer material läggs till, utan att innehållet samtidigt bilr mer och mer ohanterligt? En enskild användare ska kunna hitta precis det den söker. Svaret ska presenteras med rätt översiktlighet. Personen ska alltså inte behöva läsa en massa detaljer i ämnet som inte är av intresse. Användaren ska heller inte behöva läsa om ämnet i kombination med något annat som inte är av intresse. Men dokumentet ska inte sakna något som användaren behöver för att förstå innehållet.

Ett ämne kan innefatta ett antal andra ämnen. Exempelvis kan väderlek innefatta ämnen så som passande klädsel, aktiviteter för olika väder, människors förhållnignssätt till väderlek, olika forskningsområden som anknyter till saken osv. En annan realation är den där ett ämne är en subklass av ett annat. Exempelvis är regn, sol, hagel, osv underklasser till väderlek. Ämnen kan också utgöra instanser av en eller flera klasser. Det finns böcker, tidskrifter, filmer, personer, grupper, bokförlag, affärer, osv. Samt innehållstyper så som sammanfattningar, skildringar av händelser, historiebeskrivningar, experiment, intervjuer, reportage, handledningar, osv.

Ett ämne kan behandlas ur många perspektiv. Många olika områden kan behandla aspekter som är gemensamma mellan områden. Att finna sådana kopplingar kan leda till ökad förståelse av ämnet och även skapa ny kunskap. Tänk er exempelvis att någon har ett intresse av NDE. En aspekt i NDE är det förändrade medvatandetillståndet. Andra förändrade medvetandetillstånd dyker upp i samband med UFO-närkontakter, hypnos, ganzfeld, vissa droger, osv. Kanske någon av de åtskilda områdena har relevans för förståelsen av NDE?

För att maximera utvecklingen inom ett område, är det bäst att uppmuntra alla att deltaga med egna bidrag. Open source fungerar även inom kunskapsökningen. Vi vill gärna ta till vara på all inspiration, kunskap, erfarenhet osv. När en besökare får impulsen att vilja bidraga, ska detta ske så smärtfritt som möjligt. Men än viktigare är att varje persons bidrag ökar den totala kunskapsnivån i systemet och samtidigt skapar mer ordning snarare än oordning. Mer överblick snarare än kaos. Klara samband.

Utformning

Det system jag vill skapa ska kunna hantera situationen beskriven ovan. Ett antal aspekter ingår:

Medlemssidor

Varje besökare som tar steget att logga in sig som medlem i webbplatsen kan deltaga i dess utveckling. Deras presentation av sig själva hamnar på en egen sida. Länkar kommer automatiskt att uppkomma till andra sidor där de bidragit med något, eller bara sidor de har extra stort intresse av.

Kontaktnät inom intresseområden

Mycket kunskap finns på WWW. Mer finns samlat i böcker. Men ofta är det bästa sättet att lära sig något helt enkelt att fråga en person som vet svaret. Då gäller det bara att hitta rätt person.

Undrar du om något i en bok? Om inte författaren själv är lätt tillgänglig kanske någon annan av besökarna läst samma bok? När du själv ser boksidan kanske du har lust att säga: "den har jag läst, och jag tyckte den var jättebra". Så om allt du behöver göra är att klicka på en betygsknapp, kan nästa person enkelt hitta någon att prata med boken om. Du kanske till och med vill kommentera innehållet? Ännu mera: du har en fråga om ett ämnesområde och vill gärna fråga någon som dels läst flera böcker i ämnet och även har egen erfarenhet. Med en intelligent gruppering skulle detta kunna synas direkt från ämnessidan.

För varje ämne vill man kunna se vilka som är intresserade av det, praktiserar det, kan mycket om det, osv. Detta ska synas på ämnets sida, dels i relevanta super/sub-kategorier av ämnet och dels i en total sammanställning knytet till presentationssidan för varje enskil person. Detta bygger givetvis på medgivande från besökaren och har till syfte att främja kontakt med rätt personer.

Ömsesidig kvalitetsutveckling med versionshantering och säkerhet

Uppbyggandet av ett hypertextlexikon genom ett virtual community är en ständigt pågående aktivitet mot allt större materialmängd, men framför allt mot allt högre kvalitet. Bristfälliga artiklar kan kompleteras, redigeras eller bytas ut mot ett bättre alternativ när någon dyker upp med viljan/kunskapen att göra det.

Arbetet är kollektivt, men samordnas av någon engagerad. Då alla sidor har en eller flera intressenter som får mail vid uppdatering, kommer allt att granskas. Sidor eller avdelningar (klasser av ämnen) ägs av en person som har huvudansvaret för innehållet. Alla medlemmar och besökare har olika behörighetsgrader beroende på visat engagemang och kunnande i den tekniska strukturen. Alla kan uppdatera sidor och göra kommentarer och nya bidrag, men dessa kommer alltid att filtreras av ett antal intresserade som enkelt kan gå tillbaka till en tidigare version om så skulle vara att föredra. Ändringar av anonyma och nya medlemmar kommer inte att synas utåt innan de kvalitetsgranskats av någon med högre behörighetsnivå.

Personligt utformade sidor och språkhantering

Webbsidorna kommer att se olika ut beroende på vem som kommer in på dem. För det första kan en sida finnas i flera olika språk. Språkhanteringen finns inbyggd i HTTP och HTML. Vid varje GET-request anges villket språk man helst vill ha sin sida på. Det finns ett par olika sätt att behandla detta på. Dels kan en sida finnas i två versioner, tack vare en mänsklig översättning. Då kan innehållet komma at glida ifrån varandra vid efterföljande uppdateringar. Om vissa sidor finns på engelska, andra på svenska och några på norska eller danska, kan länkar till sidor i ett språk läsaren inte behärskar, gömmas eller markeras. Om ett par år kan automatisk sidöversättning bli bättre och mer tillgänglig. Redan idag har besökare möjlighet att själv filtrera sidor genom ett översättningsprogram.

Det finns en rad olika element i webbsidorna som kommer att anpassas till den enskilde besökaren. Icke registrerade besökare får en standardversion. Ingen ska behöva skriva in sig för att kunna läsa sidorna.

Nyheter
Material i alla slags menyer och länklistor kan markeras som nytt, uppdaterat, utökat, osv i förhållande till när besökaren senast var inne på respektive sida.
Utseende
Defaultutseendet är relativt sparsamt för att vara enkelt, snabbt och användbart för alla. Men de som vill ha en snyggare inramning kan få det. Mallar för att få sidorna att se ut som blad ur böcker, eller med sci-fi-utseende, eller med frames eller andra länklistor integrerade kan väljas efter behag.
Prioritering efter intresse
Material som passar med besökarens intresseprofil kan rekommenderas från startsidan. När sidan besökts tags nästa intressanta sida dess plats. På alla ämnessidor kan de mer intressanta länkarna prioriteras. Besökaren kan ha angivit olika grader av intresse för böcker, filmer, grupper, kontakt med andra med samma intresse, osv. Brytpunkter kan specifieras.
Diskussioner
Diskussioner kan föras på flera sätt. Snarare än en mailinglista kommer diskusionsinlägg att knytas in den övriga strukturen och knytas till ett eller flera ämnen. Varje enskild besökare väljer hur mycket av diskussionsinlägg som ska synas i anknytning till sidorna och huruvida de är öppna för chatt. Diskussioner, liksom annat nytt material, kan skickas som email, ICQ, IRC, etc.
Bidrag
Från varje sida kan man gå in för att lägga in nya kopplingar mellan sidor, rätta stav- eller sakfel, göra tillägg, osv. Kontrollknappar för dessa kan visas antingen default eller om man vill gå in för att editera sidan. Knappar för att hoppa mellan olika versioner av sidan och för att ändra en massa annan metadata kan också finnas tillgänglig beroende på besökarens rättigheter och önskemål.

Korsreferenser, korsbefruktning

Målet är inte bara att samanställa stora mängder vetskap i ett område, utan även att genom sammanställningen skapa nytt vetande. Just kopplingen mellan ämnen med beskrivningar av hur de relaterar till varandra kan ge nya insikter. Ett ämne kan behandlas ur flera olika perspektiv. Ämnet kan då länka till de olika vinklarna och andra ämnen kan länka till sidan där ämnet behandlas ur sitt perspektiv.

Utvecklingen här skulle kunna ske i ett par steg, där någon först gör en koppling mellan två ämnen och där kanske någon annan senare utvecklar detta till en egen sida. Senare kan det nya ämnet relateras till andra, genom att integreras i deras sammanställningar. Detta sker genom dialog mellan medvekande intresserade. Personer med intressen i ett område upptäcker kopplingar till ett annat område och kan därmed bidra med sin expertise till det andra området samtidigt som han lär sig sådant som har relevans till det första området.

Länkagenter

Webbplatsen i sig är ett hypertextlexikon. Men för varje ämne kan det finnas andra webbplatser med intressanta sidor för ämnet. Automatkontroll av länkar kan ske för att avgöra att siterna fungerar och se huruvida de uppdaterats. Agenter kan även för varje ämne, söka på sökmotorer efter intressanta sidor och rapportera nytillkomna högrankade sidor för ett visst ämne. Dessa kan vidare poängsättas genom olika algoritmer, och senare även poängsättas utefter hur användarena relaterar till dem. (Klickar de på länken, och strax efter nästa länk, var första länken inte så bra som den verkade.)

Även inom webbplatsen används länkhantering för att automatiskt lägga in länkar till definitioner av ord, begrepp, personer, osv. Länkarnas status kan modifieras av de som vill och även de sökmönster som används för att skapa länkarna.

Etc...

Vidare finns även avancerade planer för navigering genom ämnesträd (ala Yahoo) samt intelligent fritextsökning (ala Google), allt integrerat med besökarens profil.

Lösningen: RDF

Jag har under mycket funderande och skissande kommit fram till en datamodell som på ett enkelt pragmatiskt sätt ska innefatta all den funktionalitet jag vill komma åt.

Men då läste jag än en gång om RDF och insåg att detta var precis den sorts struktur jag ville ha. Min egen lösning var mer optimerad och förenklad för att stödja det den funktionalitet jag ville komma åt, men ska man göra det rätt ska det vara RDF, så att det i framtiden går att låta webbplatsen växa samman med andra webbplatser med liknande ambitioner men andra ämnesinriktningar.

RDF och dess schema specifikation, ger alltså den bas som behövs för att skapa den datastruktur jag vill ha för min webbplats, med alla dess relationer. Jag har skrivit en överblick över W3C, SGML, DTD, DSSSL, HTML, CSS, XML, XSL, RDF, PICS, P3P, osv...

Jag tänker implementera detta, ett steg i taget, med Perl, PostgreSQL, Template-Toolkit, osv. Basen vill jag hålla som Open Source och därmed delta i den gemensamma utvecklingen av moduler för XML, RDF, osv.

Milstolpar

  1. Skapa perl-modul för RDF-program
  2. Omstrukturera datamodellen för RDF
  3. Implementera en minimal version för medlemsregistret
  4. Läs in alla webbsidor, med dess titlar, beskrivningar och nyckelord
  5. Skapa första version av rutin för att kompletera en sida med dess relation till andra sidor
  6. Gör om sökfunktionen för att använda databasen i första hand.
  7. ...

Historia

(från nyhetssidan)

1998-07-09
En första version av databasen är färdigdesignad. Den siktar på att implementera allt och mer där till av det jag diskuterade för över ett år sedan i mina visioner om en webplats funktioner. Och det är en extremt flexibel uppbyggnad. Så nu är det bara att implementera bit för bit. Först på tur är själva medlemslistan. Det går inte att föra posterna rakt in eftersom i teorin vad som helst kan vara medlem nu (så som föreningar, familjer, etc) och sådant som medlemmens hemsideadress implementeras som länkar kopplade från personer, vilka inte nödvändigtvis behöver vara medlemmar. Dessutom har jag velat ha kvar en stor del som rena html-filer för att aldrig vara helt beroende av databas och program.
1998-09-06
Jag har prioriterat arbetet med databasdesignen den sista tiden. Nu har 14 sidors klotter förts över till en databasdefinition på ca 200 rader. Det är en mycket generell desing som närmast är en databas för att representera en föränderlig databas med ständigt nya och växlande relationer och kopplingar fram och tillbaka. Inbyggda i strukturen är versionshantering, stöd för flera språk, behörighetsnivåer, mallar, nyhetsförmedling, osv. Det här är mycket mer än vad som går att förklara på några få rader. Jag försöker halvautomatisera allt och skräddarsy sidorna för varje enskild besökare. Jag vill skapa en miljö där det är enkelt att se vilka medlemmar som kan ett ämne lika väl som vilka webplatser, böcker, grupper som behandlar ämnet. Alla besökare ska direkt kunna lägga till material till varje enskild sida, och detta kommer med automatik att länkas upp från varje annan relaterad sida. Det kommer att ta tid att implementera alla delar. Jag ska försöka dela upp arbetet så att införandet sker i små delar. Jag kommer att börja med person-sidorna eftersom de även kommer att användas av varje enskild medlem, för presentation, etc. Ni kommer nog att få se en del av resultatet i början av 1999. Håll tummarna för mig.
1998-09-13
Börjat skapa program för att gå igenom alla websidor och utföra olika saker, så som att kolla länkar och uppdatera databasen. Passade på att radera eller rätta mängder med länkar från psi-sektionen.
1998-09-13
Såg nyligen att World Wide Web Consortcium arbetat på ett ramverk liknande det jag utvecklar för mina websidor. De kallar ramverket för Resource Description Framework och har en ganska komplex objektstruktur. Min första reaktion var att jag helt enkelt kunde använda RDF istället för min egna databasdesing. Men vid närmare läsning insåg jag att det skulle ta längre tid än vad jag ville lägga ned. Jag tror att jag har bättre lösningar på vissa punkter. Framför allt är alla mina lösningar speciellt framtagna för att jag enkelt ska kunna genomföra alla de saker jag tänkt mig. W3C's beskrivning av RDF's användingsområden är ungefär lika svävande/missvisande som den de har för PICS och P3P. Den stora möjlighet som jag ser är att vi kan få ett standardiserat ramverk som storeligen underlättar att göra det jag vill med denna webplats, men över flera samarbetande webplatser. Vi skulle kunna skapa globala distribuerade databaser. RDF och P3P är helt rätt tekniker. Även om jag inte orkar använda dem rakt igenom just nu, är jag helt klart beredd att skapa interface mot dem när webplatsen är klar att explodera ut över gränserna i global samverkan.
1999-01-19
Jag jobbar vidare på min vision för webbplatsen. Just nu fokuserar jag på att konvertera den modell jag utvecklat, till RDF. Blir detta verklighet kommer webbplatsen att ligga i framkanten av den teknologiska utvecklignen. Det finns inga verktyg ännu. Knappt någon som vet vad RDF är, så låt mig säga detta; När den dag kommer då datorerna med elegans kan simulera människans sätt att tänka och resonera, kommer dess minnesbank till stor del att bestå av data i RDF.
2000-01-22
Mina planer för denna webbplats har tagit flera år. Men jag forsätter. Tekniken, RDF, finns knappt ännu. Men den utvecklas av W3C och jag har börjat använda tekniken. Men det återstår mycket jobb innan ni kan se nyheterna.