# Known Residuals — jp-election-data

Version: 2026-04-18-v047  
Date: 2026-04-18

---

## 概要

本データセットの current release facts は、2025-07-20 参議院議員通常選挙の local canonical rerun をもとに構成している。

canonical の正本は各都道府県選管の municipality-level official source family であり、`00 Soumu` は municipality-level canonical source ではなく national audit baseline として扱う。

内部整合性チェック（`validate_tidy`）は全47都道府県・`hc_multi` / `hc_pr` の両系統で通過している。

以下に記載する残差は、municipality-level local canonical facts を維持したまま公開受理した national reconciliation residual である。

---

## 残差分類

### 1. hc2025 multi national microdiff

対象: `2025-07-20 hc_multi`  
内容: `00 Soumu` national baseline との間に turnout / invalid 側の微小差が残る  
差分: `eligible -8800`, `actual_voters +3814`, `valid_votes 0`, `invalid_votes +3814`  
原因推定: national aggregate 側の集計スコープ差または報告様式差。municipality leaf facts の欠落ではない  
影響: municipality-level facts と valid_votes aggregate は維持される。turnout / invalid national total にのみ微小差が残る  
状態: 分類済み・公開受理

### 2. hc2025 pr national microdiff

対象: `2025-07-20 hc_pr`  
内容: `00 Soumu` national baseline との間に valid / party sum / turnout 側の微小差が残る  
差分: `eligible -8800`, `actual_voters +2692`, `valid_votes -79.465`, `party_vote_sum -119.743`, `invalid_votes_derived +2771.465`  
原因推定: national aggregate 側の集計スコープ差、端数処理差、または official workbook family の reported total 差  
影響: municipality-level facts は維持される。national total のみ微小差が残る  
状態: 分類済み・公開受理

---

## 検証の再現方法

外部の研究者は以下の手順で独立に検証できる。

1. 各都道府県選管の公式サイトから municipality-level source family を取得する
2. canonical `fact_candidate_votes` と `fact_district_stats` を都道府県別・全国別に集計する
3. 内部整合性として `valid_votes` と party vote total を照合する
4. `00 Soumu` national aggregate と照合し、上記 residual を確認する

---

## 残差の扱いに関する方針

残差は隠さず公開する。これはデータの欠陥を隠さないための disclosure policy であり、municipality-level canonical facts を unsafe な補正で改変しないための方針でもある。

完全な一致が確認できない箇所を明示することで、利用者が自身の分析においてどの程度の精度を前提にできるかを判断できるようにする。
