“Det finns tre sorters lögner: lögner, förbannade lögner och statistik.”
Detta vilt kringflaxande citat tillskrivs Benjamin Disraeli, Storbritanniens premiärminister 1868 och 1874-1880, med Samuel Langhorne Clemens (Mark Twain) som avsändare i hans självbiografi.
Det är förmodligen en lögn det med, eller möjligen ett misstag i all välmening. Uttrycket är de facto några decennier äldre än Benjamins dagar vid den brittiska styrpulten.
Ordet statistik “uppfanns” dock under 1800-talet, även om tillämpningen av statistik är äldre. Engelsmannen William Petty använde statistiska metoder – för att räkna folk – redan på 1600-talet så att man kunde beskatta irländarna på ett “bra sätt”. Irländarna kan ha haft en annan uppfattning. Kanske var det en irländare som tyckte att det var lögn?
Statistik är inte lögn. Men för den oinsatte ter sig siffror och termer ofta som vilseledande rök. Kunskap är makt.
Finns det nåt torrare än statistik? Några få saker. Gamla mariekex.
Nedanstående mellanstycke kan man hoppa över. För den roade kan det vara skoj, men i övrigt otroligt torrt. Jag har varnat er
================
Statistik har två olika syften.
Deskriptiv statistik : Att i ett fåtal begrepp beskriva en population (av personer eller objekt) utan att behöva räkna upp egenskaper varje individuellt objekt. Helt enkelt att skaffa sig en “modell” av verkligheten. Vanliga begrepp är genomsnitt och vidden av data. Dessa begrepp finns i några varianter, beroende på vad det är man mäter.
Statistisk inferens (hypotesprövning): Att mot bakgrund av sannolikhet jämföra den modell man fått fram, enligt ovan, med vad man hade utgått ifrån enligt en nollhypotes. Exempelvis att varje sida på yatzietärningarna har samma sannolikhet att få upp en viss sida. Sannolikheten att få en sexa är ⅙. Sannolikheten att få fem sexor i ett kast är (⅙)^5. Det är svårt men inte helt osannolikt. Men får man samma resultat tre gånger på raken börjar man ana ulvar i träsket. Hur sannolikt är det? Precis!
“Fusk, min herre. Fusk!!”, som Caligula med Hets uttryckte saken.
============
Statistik i sig är inte lögn, det är bara ett sätt avteckna verkligheten.
Ett annat sätt att se på statistik är att peka på att det är fullkomligt osannolikt att Mona-Lisa såg ut som da Vinci avtecknat henne. Hon var definitivt tredimensionell, om inte annat. Hon satt helt enkelt modell för en modell av sig själv.
Man kan göra statistik av träden i en skogsdunge, om man vill. Man kan räkna antal träd totalt eller av olika trädarter. Man kan mäta höjd, ålder, trädkronans vidd, antal blommor, rotens djup, antal äpplen etc.
Nu blev det jobbigt. Eller?
Tänk på att det är OLIKA trädarter och att det inom respektive art råder olika mått. Då måste det väl inom varje art bli egna modeller? Faktum är att skapa modeller är det som din hjärna gör automatiskt. Du har skapat dig en mental modell av hur en tall ska se ut. Hoppas jag.
Men skogstall och bergtall då? Skillnaderna krymper och siffror och mått går in i varandra.
Vi kommer in på det område som benämns MultiVariat DataAnalys (MVDA), dvs matematisk-statistiska metoder för att härleda modeller av objekt som kan beskrivas med flera variabler. Det går också att pröva hypoteser med multivariata modeller.
Eller så kan man skapa nåt slags modell som kan användas för att förutsäga hur mycket äpplen som de olika träden kan släppa i huvudet på Newton.
Det var precis det som svensk-norrmannen Herman Wold funderade över. Bortsett från att han höll på med galopphästar i USA innehade han ett antal professurer i statistik och var medlem av “priskommittén för Sveriges riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne” mellan 1968 och 1980.
Det närmar sig.
Herman Wold utvecklade det som kallas Partial Least Squares regression (PLS), dvs ett sätt att härleda samband mellan multivariata modeller och därtill associerade utfall. Som exempelvis att äppelträds olika ålder, storlek, antal blommor etc ger olika stora skördar av äpplen.
Äpplet faller inte långt från äppelträdet.
Herman Wolds son Svante Wold axlade nämligtvis manteln och var professor i Kemometri (MVDA av kemiska data) vid bland annat Umeås universitet. Han gick bort 2022.
Svantes syster Agnes är fallen från samma äppelträd. Hon är professor i bakteriologi och förekommer ofta i media när det gäller att debunka hälsomyter.
Svantes och Agnes mamma hette Anna-Lisa Arrhenius som ogift. Hon var dotter till Svante Arrhenius, sveriges första Nobelpristagare.
Just denna Svante d.ä. fick Nobelpriset i kemi för sitt arbete med den elektrolytiska dissociationsteorin. Han anses vara den fysikaliska kemins grundare och har fått Arrheniuslaboratoriet – byggt 1973 vid Stockholms universitet till sin ära.
Omfattningen av Svantes gärningar inom olika vetenskapliga discipliner skulle bli ett kapitel för sig. Så nog om detta.
Av särskilt intresse kan ändå vara att han var den första att härleda ett samband mellan temperatur och atmosfäriskt koldioxid, dvs växthuseffekten.
============
Att samma släktfölje, från Svante Arrhenius via svärsonen Herman Wold till barnbarnen Svante och Agnes, skulle bära så mycken grad av bildning och genialitet skulle vara direkt osannolikt om nollhypotesen att genialitet är slumpmässigt fördelad trots allt skulle stämma.
Vi kan därför dra slutsatsen att nollhypotesen kan förkastas på 5% nivå.
Alternativt kan vi unisont skrika
”Fusk, min herre. Fusk!!”
=========
Utifrån existerande parametrar har jag beräknat att sannolikheten för att ens 1% av gruppens medlemmar skulle ha mäktat med att läsa denna text är… %…..

I just watched an AI build an entire marketing campaign.Videos, landing pages, ads, emails, everything done in under 60 seconds.
No team. No copywriters. No designers.Just AISellers, the all-in-one AI marketing platform I’ve been quietly testing… until now.
This [day], [date and time], I’m joining a special live webinar where AISellers will be revealed to the public for the first time.
Click here for more info : https://jvz6.com/c/688203/418587/