Hvilke data har vi?

Reference til felter i denne beta. Opdateret ud fra data/species_index.json (1194 arter), data/manifest.json, BirdNET-labels og ingest-API.

1. species_index.json (én post pr. art)

Felt Type Hvor kommer det fra? Dækning (typisk)
birdnet_class_index heltal Indeks i BirdNET v2.4 labels.json (global rækkefølge). Når navn findes i BirdNET-listen
scientific_name tekst GBIF backbone / artens latinske navn. Altid
gbif_taxon_key heltal / null GBIF species key. Næsten altid
da_common_name tekst GBIF vernacular (dan). Ofte
en_gb_common_name
fallback_en
tekst GBIF engelsk (prioriteret IOC-lignende kilder i bootstrap). Ofte
family tekst / null GBIF art + rank. Meget høj
image_file sti Wikimedia Commons (automatisk søgning) eller pladsholder. Næsten alle har filsti
image_style
image_source
tekst Proveniens (fx photograph, commons_search). Når billede sat
habitat tekst / null tools/enrich_species_index.py — da/en Wikipedia-resumé. Stiger når berigelse er kørt færdig
diet_primary
diet_details
tekst / null diet_details: sætning fra engelsk uddrag; diet_primary: grov label (fx omni-/insektivor) via enrich_species_index.py heuristik. Stiger ved berigelse
resident_type
migration_pattern
diel_pattern
tekst / null GBIF/Wikidata stadig muligt; nu også søgeords-heuristik på engelsk Wikipedia (dag/nat, træk). Varierer; ofte delvist ved berigelse
wingspan_cm_min / max
eggs_min / max
tal / null Regex på engelsk/dansk tekst (vingefang, wingspan, clutch …) i enrich_species_index.py. Når artiklen nævner tal
mating_season
nesting_season
tekst / null Korte intervaller (fx apr–jun) når “breeding season … April to June” / “nests from …” findes i engelsk tekst. Sjældent; afhænger af formulering
conservation_status tekst / null Klar til IUCN / GBIF. Oftest tom
months_occurrence 12 tal GBIF-lignende sæson (plan); tom array indtil berigelse. Oftest tom
peak_months liste tal Udledt peak-måneder; tom indtil berigelse. Oftest tom

2. data/manifest.json

NøgleBetydning
version / schemaDatasæt-version og skemanavn.
locale_primaryda
country_filterDK (GBIF / liste-politik).
species_countAntal rækker i species_index.json.
knowledge_sourcesHvilke pipelines der byggede listen (GBIF, Commons, …).
species_index / birdnet_label_mapFilnavne.
birdnet_version / birdnet_tfjs_modelBundlet BirdNET v2.4 TF.js.

3. data/birdnet_label_map.json

IndholdBetydning
birdnet_version, label_sourceMetadata.
labels[]Liste af { "index", "scientific_name" } — 6522 klasser, samme orden som BirdNET v2.4.

4. api/ingest.php (observation ved upload)

Felt (JSON)Betydning
scientific_namePåkrævet.
lat / lonFuzzede koordinater (påkrævet).
birdnet_class_indexOptional.
confidenceModel-score.
rms_dbfsValgfri signal-metric.
fuzz_kmTypisk 1.
client_sessionValgfri sessions-id.
raw_jsonHele payload gemmes i MySQL.

← Tilbage til appen · Seneste målte dækning i workspace: familie ~100%, rigtigt billede ~99%, habitat/diet afhænger af om enrich_species_index.py er kørt færdig på alle 1194 arter.