Det jag vill göra bygger på mina idéer och den erfarenhet och de program jag har från Inormation Highway Göteborg, paranormal.se, SKIP och de komponenter jag utvecklat under tiden. En del av det (interna) pågående arbetet ligger under wraf.para.se.
Alla sidor har (nästan helt) konverterats till XML. Anledningen är att jag vill automatisera hanteringen av webbsidorna. Med XML blir det enklare att skriva program som läser in en webbsida i en trädstruktur, uppdaterar / tar bort / lägger till någon del i sidan, och skriver ut den uppdaterade webbsidan. En webbsida kan vara långt mer komplex än vad som går att representera med en vanlig databas. Exempelvis kan en bekrivning av en bok innehålla mängder av referenser till författare, förlag, ämnen, kommentarer, osv. Var och en av dessa kan ha ytterligare info kopplad till sig som i sin tur kan ha egna kopplingar och referenser. XML är skapad för att representera sådana komplexa datastrukturer.
Jag vill skapa ett hypertextlexikon. Varje sida behandlar ett ämne. Alla följdfrågot och undringar en läsare kan få från sidans ämne ska besvaras av länkar från sidan, på den plats där frågan uppstår. Exempelvis kan förekommande facktermer i en text länkas till en sida som förklarar dem och begrepp i texten länkas till sidor som behandlar begreppen. I en akademisk text förekommer ofta referenser både till andra texter och inom texten. Även dessa skulle kunna vara hypertextlänkar. I ett lexikon brukar ord i texten med fet stil ange att dessa ord kan slås upp. Där förekommer också ett antal "Se också" som pekar till uppslagsord där man kan läsa mer om ämnet, ur andra perspektiv.
Målet är att skapa en miljö för kunskapsuppbyggande. Vilket ämne som väljs spelar ingen större roll. Men det är en fördel att inte ha ett alltför stort område.
Problemet med många ansamlingar av dokument är att ju fler som tillkommer, desto mer oöverskådligt blir det. Innehållet i många dokument överlappar varandra. Vill man få all information om ett område blir man då tvungen att ta alla dessa dokument i beaktande genom att plöja igenom dem och läsa mer eller mindre samma sak om och om igen, för att hitta det som är unikt i varje ny avhandling i samma ämne.
Så hur skapar man en miljö där mer och mer material läggs till, utan att innehållet samtidigt bilr mer och mer ohanterligt? En enskild användare ska kunna hitta precis det den söker. Svaret ska presenteras med rätt översiktlighet. Personen ska alltså inte behöva läsa en massa detaljer i ämnet som inte är av intresse. Användaren ska heller inte behöva läsa om ämnet i kombination med något annat som inte är av intresse. Men dokumentet ska inte sakna något som användaren behöver för att förstå innehållet.
Ett ämne kan innefatta ett antal andra ämnen. Exempelvis kan väderlek innefatta ämnen så som passande klädsel, aktiviteter för olika väder, människors förhållnignssätt till väderlek, olika forskningsområden som anknyter till saken osv. En annan realation är den där ett ämne är en subklass av ett annat. Exempelvis är regn, sol, hagel, osv underklasser till väderlek. Ämnen kan också utgöra instanser av en eller flera klasser. Det finns böcker, tidskrifter, filmer, personer, grupper, bokförlag, affärer, osv. Samt innehållstyper så som sammanfattningar, skildringar av händelser, historiebeskrivningar, experiment, intervjuer, reportage, handledningar, osv.
Ett ämne kan behandlas ur många perspektiv. Många olika områden kan behandla aspekter som är gemensamma mellan områden. Att finna sådana kopplingar kan leda till ökad förståelse av ämnet och även skapa ny kunskap. Tänk er exempelvis att någon har ett intresse av NDE. En aspekt i NDE är det förändrade medvatandetillståndet. Andra förändrade medvetandetillstånd dyker upp i samband med UFO-närkontakter, hypnos, ganzfeld, vissa droger, osv. Kanske någon av de åtskilda områdena har relevans för förståelsen av NDE?
För att maximera utvecklingen inom ett område, är det bäst att uppmuntra alla att deltaga med egna bidrag. Open source fungerar även inom kunskapsökningen. Vi vill gärna ta till vara på all inspiration, kunskap, erfarenhet osv. När en besökare får impulsen att vilja bidraga, ska detta ske så smärtfritt som möjligt. Men än viktigare är att varje persons bidrag ökar den totala kunskapsnivån i systemet och samtidigt skapar mer ordning snarare än oordning. Mer överblick snarare än kaos. Klara samband.
Det system jag vill skapa ska kunna hantera situationen beskriven ovan. Ett antal aspekter ingår:
Varje besökare som tar steget att logga in sig som medlem i webbplatsen kan deltaga i dess utveckling. Deras presentation av sig själva hamnar på en egen sida. Länkar kommer automatiskt att uppkomma till andra sidor där de bidragit med något, eller bara sidor de har extra stort intresse av.
Mycket kunskap finns på WWW. Mer finns samlat i böcker. Men ofta är det bästa sättet att lära sig något helt enkelt att fråga en person som vet svaret. Då gäller det bara att hitta rätt person.
Undrar du om något i en bok? Om inte författaren själv är lätt tillgänglig kanske någon annan av besökarna läst samma bok? När du själv ser boksidan kanske du har lust att säga: "den har jag läst, och jag tyckte den var jättebra". Så om allt du behöver göra är att klicka på en betygsknapp, kan nästa person enkelt hitta någon att prata med boken om. Du kanske till och med vill kommentera innehållet? Ännu mera: du har en fråga om ett ämnesområde och vill gärna fråga någon som dels läst flera böcker i ämnet och även har egen erfarenhet. Med en intelligent gruppering skulle detta kunna synas direkt från ämnessidan.
För varje ämne vill man kunna se vilka som är intresserade av det, praktiserar det, kan mycket om det, osv. Detta ska synas på ämnets sida, dels i relevanta super/sub-kategorier av ämnet och dels i en total sammanställning knytet till presentationssidan för varje enskil person. Detta bygger givetvis på medgivande från besökaren och har till syfte att främja kontakt med rätt personer.
Uppbyggandet av ett hypertextlexikon genom ett virtual community är en ständigt pågående aktivitet mot allt större materialmängd, men framför allt mot allt högre kvalitet. Bristfälliga artiklar kan kompleteras, redigeras eller bytas ut mot ett bättre alternativ när någon dyker upp med viljan/kunskapen att göra det.
Arbetet är kollektivt, men samordnas av någon engagerad. Då alla sidor har en eller flera intressenter som får mail vid uppdatering, kommer allt att granskas. Sidor eller avdelningar (klasser av ämnen) ägs av en person som har huvudansvaret för innehållet. Alla medlemmar och besökare har olika behörighetsgrader beroende på visat engagemang och kunnande i den tekniska strukturen. Alla kan uppdatera sidor och göra kommentarer och nya bidrag, men dessa kommer alltid att filtreras av ett antal intresserade som enkelt kan gå tillbaka till en tidigare version om så skulle vara att föredra. Ändringar av anonyma och nya medlemmar kommer inte att synas utåt innan de kvalitetsgranskats av någon med högre behörighetsnivå.
Webbsidorna kommer att se olika ut beroende på vem som kommer in på dem. För det första kan en sida finnas i flera olika språk. Språkhanteringen finns inbyggd i HTTP och HTML. Vid varje GET-request anges villket språk man helst vill ha sin sida på. Det finns ett par olika sätt att behandla detta på. Dels kan en sida finnas i två versioner, tack vare en mänsklig översättning. Då kan innehållet komma at glida ifrån varandra vid efterföljande uppdateringar. Om vissa sidor finns på engelska, andra på svenska och några på norska eller danska, kan länkar till sidor i ett språk läsaren inte behärskar, gömmas eller markeras. Om ett par år kan automatisk sidöversättning bli bättre och mer tillgänglig. Redan idag har besökare möjlighet att själv filtrera sidor genom ett översättningsprogram.
Det finns en rad olika element i webbsidorna som kommer att anpassas till den enskilde besökaren. Icke registrerade besökare får en standardversion. Ingen ska behöva skriva in sig för att kunna läsa sidorna.
Målet är inte bara att samanställa stora mängder vetskap i ett område, utan även att genom sammanställningen skapa nytt vetande. Just kopplingen mellan ämnen med beskrivningar av hur de relaterar till varandra kan ge nya insikter. Ett ämne kan behandlas ur flera olika perspektiv. Ämnet kan då länka till de olika vinklarna och andra ämnen kan länka till sidan där ämnet behandlas ur sitt perspektiv.
Utvecklingen här skulle kunna ske i ett par steg, där någon först gör en koppling mellan två ämnen och där kanske någon annan senare utvecklar detta till en egen sida. Senare kan det nya ämnet relateras till andra, genom att integreras i deras sammanställningar. Detta sker genom dialog mellan medvekande intresserade. Personer med intressen i ett område upptäcker kopplingar till ett annat område och kan därmed bidra med sin expertise till det andra området samtidigt som han lär sig sådant som har relevans till det första området.
Webbplatsen i sig är ett hypertextlexikon. Men för varje ämne kan det finnas andra webbplatser med intressanta sidor för ämnet. Automatkontroll av länkar kan ske för att avgöra att siterna fungerar och se huruvida de uppdaterats. Agenter kan även för varje ämne, söka på sökmotorer efter intressanta sidor och rapportera nytillkomna högrankade sidor för ett visst ämne. Dessa kan vidare poängsättas genom olika algoritmer, och senare även poängsättas utefter hur användarena relaterar till dem. (Klickar de på länken, och strax efter nästa länk, var första länken inte så bra som den verkade.)
Även inom webbplatsen används länkhantering för att automatiskt lägga in länkar till definitioner av ord, begrepp, personer, osv. Länkarnas status kan modifieras av de som vill och även de sökmönster som används för att skapa länkarna.
Vidare finns även avancerade planer för navigering genom ämnesträd (ala Yahoo) samt intelligent fritextsökning (ala Google), allt integrerat med besökarens profil.
Jag har under mycket funderande och skissande kommit fram till en datamodell som på ett enkelt pragmatiskt sätt ska innefatta all den funktionalitet jag vill komma åt.
Men då läste jag än en gång om RDF och insåg att detta var precis den sorts struktur jag ville ha. Min egen lösning var mer optimerad och förenklad för att stödja det den funktionalitet jag ville komma åt, men ska man göra det rätt ska det vara RDF, så att det i framtiden går att låta webbplatsen växa samman med andra webbplatser med liknande ambitioner men andra ämnesinriktningar.
RDF och dess schema specifikation, ger alltså den bas som behövs för att skapa den datastruktur jag vill ha för min webbplats, med alla dess relationer. Jag har skrivit en överblick över W3C, SGML, DTD, DSSSL, HTML, CSS, XML, XSL, RDF, PICS, P3P, osv...
Jag tänker implementera detta, ett steg i taget, med Perl, PostgreSQL, Template-Toolkit, osv. Basen vill jag hålla som Open Source och därmed delta i den gemensamma utvecklingen av moduler för XML, RDF, osv.
(från nyhetssidan)