(Go: >> BACK << -|- >> HOME <<)

Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SBL dataset släpps 2024 Strings not Things #53

Open
Tracked by #6
salgo60 opened this issue May 14, 2024 · 11 comments
Open
Tracked by #6

SBL dataset släpps 2024 Strings not Things #53

salgo60 opened this issue May 14, 2024 · 11 comments

Comments

@salgo60
Copy link
Owner
salgo60 commented May 14, 2024

Wikidata skapade för 8 år sedan 2016-sep-21 koppling till SBL - se blogpost 2017

image

Nytt dataset från SBL släpps 2024-maj där namn är textsträngar och yrken inte har HISCOkoder, där församlingar är icke unika textsträngar, inga källor kopplas till fakta, släktartiklar helt saknar metadata ocjh persistenta identifierare för personer....

image

Jupyter Notebook -> csv till pandas

image image

Postbeskrivning

image ----

Vad hände med hen som anställdes att skapa nya API:er - det blev en tummetott en csv fil

image

Uppenbara problem med Riksarkivets dataset

Känns som Riksarkivet inte jobbar ingenjörsmässigt utan det blir ostrukturerat och spretigt.

  1. Textsträngar: hade varit bättre om Riksarkivet hämtat ut det data som finns i Wikidata så hade dom haft persistenta identifierar för församlingar, samma som Wikidata --> ha samma som SWERIK för Riksdagsmän......
    1. i Wikidata har ni även massa fall där SBL inte överensstämmer med kyrkböckerna
      se mer saker som jag tycker kan vara mera proffsigt Visionen med SBL - har vi tappat den på 100 år #6
  2. Vara kompatibla med andra dataset: Termer borde även det kopplas till andra termkataloger se bl.a. detta med yrken och HISCOkoder - det kommer aldrig gå att jobba digitalt om saker som detta levereras
    1. Galet med egna hittepå_ konstruktioner som "Prefix to year of death" / "Prefix to year of birth" .... hur skall svenskt kulturarv kunna koppla ihop sig om ni alla skapar silos med egna konstruktioner
      1. Funder över att använda ex. SKOS se dialog med Skansen som inte heller dom är ingengörsmässiga
  3. Arbeta aktivt med er metadatadebt se #29
  4. Finns det tankar om change management hos Riksarkivet? Datasettet ovan heter SBL_2023.csv hur kommer dom hantera ändringar?
    1. jag har tidigare saknat att Riksarkivet hantera felrapporteringen proffsigt Riksarkivet saknar öppna publika backloggar och tydliga helpdesknummer #3 - gissar att dumpa nya dataset med ändringar utan versionshantering och källor blir för den som skall använda det ett Maintenance Hell jmf RAÄ
  5. FAIRDATA F1 - alla personer yrken platser skall ha persistenta unika identifierare Riksarkivet SBL: Släktartiklar saknar persistenta identifierare för personerna i biografierna #7

image

Felaktigt data i SBL enl. Wikidata

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

Finns även lite tester med att lyfta in släktartiklarna till wikidata se #7 (comment)

image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

Wikidata - SBL P

SPARQL https://w.wiki/BuJ

Properties wd:Q19595382 --> Auktoritetsdata for people

image image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

All External Properties https://w.wiki/A58D

image image image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

All WD Properties for P3217 SBL https://w.wiki/A58M

image image image image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

Pie Chart Properties https://w.wiki/A58Q

image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

Tidslinje SBL Wikidata

image

Man / kvinna / trans

image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

PROV

2024 bör metadata finnas med provenance PROV

Idag saknar jag tankar om provenance - PROV hos Riksarkivet se #50 och hur klassificering av # 139 politiska vildar i Riksdagen beskrivs olika av olika källor


RDF Triples for Political Figures:

<http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> a foaf:Image ;
  dc:subject wd:Q4582704 ;
  foaf:depiction wd:Q4582704 ;
  rdfs:label "Scanned image of Adolf Hedin" .

wd:Q4582704 a foaf:Person ;
  foaf:name "Adolf Hedin" ;
  :politicalStatus "politisk vilde" ;
  :activePeriod "1893 - 1902" ;
  :depictedIn <http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> .

<http://example.org/book/1897> a bibo:Book ;
  dc:date "1897"^^xsd:gYear ;
  dc:title "Frihandelsvänlig vilde" ;
  foaf:depiction wd:Q4582704 .

PROV-O Statements for Provenance:

<http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> prov:wasGeneratedBy :ScanningActivity ;
  prov:wasAttributedTo :DigitizationProject ;
  prov:generatedAtTime "YYYY-MM-DDT00:00:00Z"^^xsd:dateTime .

:ScanningActivity a prov:Activity ;
  prov:startedAtTime "YYYY-MM-DDT00:00:00Z"^^xsd:dateTime ;
  prov:used <http://example.org/book/1897> ;
  prov:wasAssociatedWith :DigitizationProject .

:DigitizationProject a prov:Organization ;
  prov:hadPrimarySource <http://example.org/book/1897> .

And for PROV-O, one could represent the provenance information like this:

:BookEarly1900s a prov:Entity ;
                prov:wasAttributedTo :Author1 ;
                prov:generatedAtTime "1900-01-01T00:00:00Z"^^xsd:dateTime .

:Book1985 a prov:Entity ;
          prov:wasAttributedTo :Author2 ;
          prov:generatedAtTime "1985-01-01T00:00:00Z"^^xsd:dateTime .

:ConceptOfVilde prov:wasDerivedFrom :BookEarly1900s ;
                prov:wasAlteredIn :Book1985 .

Scanned picture - frihandelsvänlig vilde wd Q118289007 - Porträttbok: Riksdagsmän 1897

image

Wikidata

image image image image

SPA has implemented very good data to track changes and who is doing what

SPA json sj9PGLAlnmUAAAAAABGeXw

image image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

SBL personer i Svenska Riksdagen 1187

se mer kopplingar Riksdagsmän

image image

Problemet att få svenska museer koppla ihop sig digitalt för svenska Riksdagsmän

image

@salgo60
Copy link
Owner Author
salgo60 commented May 14, 2024

@salgo60
Copy link
Owner Author
salgo60 commented May 16, 2024

FB fråga vad hände med tidplanen

image

@salgo60
Copy link
Owner Author
salgo60 commented May 17, 2024

SBL efter 100 år och SKBL efter 1 år

image image image

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant