研究方法

本數據庫涵蓋了所有與香港反送中抗議相關的案件。具體而言,涵蓋範圍為自2019年6月9日至2024年中旬期間,所有與反修例相關的案件在法庭審理並作出判決的情況。需注意的是,本數據集僅包括已結案的案件。隨著更多案件結案,我們將定期更新此數據集。

本數據集的資料最初由多個可靠來源彙編而成,包括記者及法律系學生。這些信息通常通過實地出席法庭審訊而獲得。隨後,我們的內部研究人員從數據集中隨機抽取樣本,並通過交叉驗證方法進行信息的三角驗證,例如與現有新聞機構的報導、獨立報告[1]進行比對,以及諮詢相關領域的專家,以確保數據的準確性、可靠性和有效性。具體來說,我們的抽樣數據至少經過兩個獨立來源的驗證。在可行的情況下,判決和裁決直接從香港司法機構網站(https://www.judiciary.hk/en/judgments_legal_reference/Jud_Ruling.html)提取。

本數據庫中的每一條目(即每一行)代表一項控罪計數,這是指被告在某案件中被指控犯有特定罪行。值得注意的是,在任何案件中可能有多名被告,每名被告可能面臨多項指控,並最終得到不同的司法結果。

由於本數據庫本數據庫依賴非政府來源,而非官方數據(官方數據多數未公開),不可避免地會存在不完整性以及偶爾的少量數據遺漏問題。由於上述原因,本資料集中部分案件編號不幸缺失。為了解決此問題並方便研究人員參考,我們為每筆數據分配了一個唯一識別碼。這些識別碼確保每筆數據即使在缺少部分案件編號的情況下,仍能被清晰區分。而對於被認為重要的資料,例如法官姓名、指控罪名、司法結果以及案件發生的日期和時間,數據缺失比例均低於1%。結合我們上述嚴謹的數據驗證過程,我們認為此數據庫的質量具一定程度的可信性。

如您希望了解更多有關本數據庫的研究方法,請通過 info.dap@protonmail.com 聯繫我們的團隊。本數據庫屬於開源資源,大部分數據由公民社會收集,而非依賴官方統計。我們熱切歡迎公眾貢獻,以增強數據的廣度和準確性。

[1] 例如,請參閱:https://www.law.georgetown.edu/law-asia/wp-content/uploads/sites/31/2023/10/GCAL-HK-2019-ARREST-DATA-REPORT-FINAL-OCT-2023.pdf