鞋底防滑 AI 檢測系統 — 交付驗收入口

🟢 正式環境（貴公司 GX10 地端）· 已上線

整套系統運行於貴公司機房的 NVIDIA GX10：真實 CV 模型 ＋ 自架語言模型（gemma4:26b，非外部 API），24 小時運行（always-on）、開機自動恢復、資料全留地端不出雲。固定網址 gx10.ai-cto.app，可多人同時使用。

🔌 雲端測試站 STG（RunPod GPU）· 自助開關

新功能先在這裡驗證,測穩了才上正式站。跑在雲端 GPU、用多少算多少：要測時自己開機、測完關機（見下方「測試站電源」面板）。與正式站是同一套系統；測試資料與正式站分開。

正式站狀態

🖥️ 地端正式站 — 24 小時運行 · 即時監控

系統跑在貴公司機房的 GX10 上，不需要開機、關機或任何操作 —— 隨時打開下方入口就能用。以下狀態與數據由本頁直接向正式站即時查詢（每 30 秒更新，非人工填寫）。

狀態：查詢中…

資料來源：正式站 gx10.ai-cto.app/healthz ＋ /metrics/（機上每分鐘採樣）。若顯示連線失敗，請聯絡 AI-CTO。

雲端測試站 STG

🔌 雲端測試站 — 自助開機 / 關機

新功能先在測試站驗證，測穩了才上正式站。測試站跑在雲端 GPU，用多少算多少：要測時開機、測完關機（閒置約 1 小時也會自動關機）。就算原本那台的 GPU 被別人租走，按「開機」會自動換一台機器 —— 網址與資料完全不變。

狀態：尚未查詢 —— 輸入密碼後按「查狀態」或「開機」

開機後服務自動還原約 4–6 分鐘，變「✅ 可測試」後下方入口即可用。測試站的檢測紀錄與照片存在獨立儲存空間：關機、換機都不會消失（最多只丟關機前 60 秒內的新紀錄）。

📦 這次交付了什麼

三角色完整平台：消費者（LINE LIFF）／鞋廠研發工作台（Web）／後台管理（Web），都接真實 API。
L1 — 電腦視覺模型 v1：鞋底照 → 乾／濕摩擦係數（COF）＋防滑等級＋磨耗熱圖。以貴公司提供之 32 雙附報告鞋款訓練而成。
L2 — 本地語言模型報告：將 COF 數值轉為約 300 字繁體中文建議，全程於本機運算、不經外部雲端（gemma4:26b）。
端到端流程：上傳三張鞋底照 → 視覺模型預測 → 語言模型生成報告 → 前台呈現分數／熱圖／報告，後台呈現統計／模型版本。
鞋廠雙報告：同一次檢測，鞋廠端同時產出「研發技術版」（含 ASTM 門檻／分區權重解讀）與「消費者白話版」，一鍵並列比對。
後台檢測紀錄：管理端可查閱所有檢測（消費者＋鞋廠來源）明細 —— COF／等級／熱圖／雙報告，含來源篩選與分頁。
機器學習開發歷程（見下方逐頁說明）：資料狀況 → 資料探勘 → 模型方法選擇 → 兩階段改良 → 成效驗證與能力邊界。

機器學習開發歷程

🔬 影像辨識模型是怎麼做出來的

本系統的影像辨識模型，係以貴公司提供的真實檢測資料訓練而成。以下以 ◀ ▶ 逐頁說明：資料的實際狀況、開發過程中採用的方法與理由、各方法的成效，以及目前模型的能力邊界，供完整了解全貌。

鞋底防滑檢測 · 機器學習開發歷程

封面

把一張鞋底照片，變成防滑安全分數

問題＋我們要做的事

問題：鞋底磨損肉眼難判斷，濕滑跌倒是真實風險；實驗室 ASTM 摩擦試驗準，但慢、貴、要送驗。

我們要做的：讓消費者拍三張鞋底照，就能得到乾／濕摩擦係數（COF）＋防滑等級＋白話建議；鞋廠／實驗室用同一套快速初篩。

電腦視覺模型
照片 → COF 數字

本地 LLM
數字 → 繁中報告

3 角色

消費者 · 鞋廠 · 後台

01 · 資料

訓練資料的實際狀況

貴公司提供之首批訓練資料

41 雙鞋

每雙 ~60 張整底各角度照

2,480 張

手持照（辦公室／實驗室背景）

32 份

附 ASTM 正式檢測報告（PDF）

其中 32 雙附 ASTM F2913 正式檢測報告；另 9 雙僅有照片、無對應報告（無標籤，本次未納入訓練）。
涵蓋 11 家鞋廠、材質含橡膠（NR）／EVA／TPR／TPE／PU。
照片為「整個鞋底各角度的手持照」、背景較雜亂 —— 此特性與後續方法選擇相關。

02 · 標籤

標籤是金級的，但鎖在 PDF 裡

ASTM F2913:2011 摩擦係數試驗

每份報告含 前掌 / 後跟 / 水平 × 乾 / 濕 共 6 個 COF 值。COF 已是 0–1 量級（濕式 0.30–0.86），剛好對齊模型輸出。

PDF 無文字層（純影像）→ 用視覺萃取數字。
用報告第 3 頁「個別量測值」的平均，逐格交叉驗證 → 32 份全部對得上（誤差僅四捨五入）。
抽驗數值較特殊者（如某粗跟女鞋後跟乾式僅 0.34）→ 比對照片確認屬實（粗跟為光滑硬質、抓地力低），非萃取錯誤。

標籤品質高（實驗室正式報告）。主要限制不在資料準確度，而在樣本數量 —— 見下一頁。

03 · 資料探勘

資料探勘：四項關鍵議題

這四點決定了後續的模型方法

① 樣本數量有限：僅 32 雙具標籤（一般期望數百至千筆）→ v1 定位為諮詢級估算工具，需採嚴謹的分組驗證。
② 照片型態與原規劃不同：實際為「整底多角度照」，非乾淨的前掌／後跟／全底分區照。
③ 樣本皆為新鞋：32 雙均為工廠新品 → 「建議更換」等級 0 筆；而消費者情境多為磨損舊鞋。
④ 乾式 COF 常 >1.0：超出模型輸出範圍 → 訓練時壓縮、推論時還原（濕式皆在範圍內，無此問題）。

04 · 模型方法

模型方法：聚焦於「整底 → 兩個數值」

輸出定為整體乾／濕兩個 COF

單張整底照（＋材質）→ 整體 (cof_wet, cof_dry)，暫不做分區輸出（現有資料量不足以支撐）。
採用凍結的 ConvNeXt-Tiny 作為特徵抽取器＋小型分類層。
（若完整微調 2,800 萬參數對應 32 筆資料，將過度擬合、退化為「永遠輸出平均值」。）
對外資料介面維持不變：產品端仍上傳 3 張分區照，推論時各推一次、以固定權重（前掌 0.30／後跟 0.40／全底 0.30）組成整體，前端／語言模型／API 皆無需調整。

05 · 方法一

方法一：移除背景雜訊（去背）

原始照片背景雜亂，會干擾模型判讀

導入去背處理（rembg / u2net），將鞋底自辦公室／實驗室背景中分離、其餘區域填白，使模型專注於鞋底本身的紋路與磨耗。

原始（含背景）R² 0.07

去背後R² 0.18

導入此方法後，濕式 32 折交叉驗證 R² 由 0.07 提升至 0.18。

06 · 方法二

方法二：分區放大（前中後三段）

檢測報告原本即以前掌／後跟分區量測

在去背後，沿鞋底長軸切分為前／中／後三段並各自放大，一併輸入模型。此作法等同提高有效解析度，也對應檢測報告原本以分區方式量測的特性。

去背R² 0.18

去背＋三段放大R² 0.32

加入分區放大後，R² 由 0.18 進一步提升至 0.32。

06.5 · 延伸嘗試

還試了什麼：多切區塊＋二值化

兩個常見的前處理改法，都用 32 折交叉驗證嚴謹實測

試法	相對出貨版	判讀
三段放大（出貨版）	基準	穩定、已採用
多切左右／內外側（6 區塊）	時好時壞（±0.10）	邊際且不穩，落在統計噪音裡
二值化（黑白化紋路）	中性～偏差	丟掉自然紋理 → 預訓練模型反而變差
多切＋二值化	崩潰	離域 × 高維 → 過度擬合

📌 這兩個改法的差異都小於方法本身的統計噪音 —— 這是一個實證結論：目前模型是「資料受限」，不是「切法／前處理受限」。把準度真正拉上去的唯一大槓桿，是累積更多穿過、磨損過的鞋的資料。

07 · 成效驗證

嚴謹的驗證方法：32 折交叉驗證（LOSO）

Leave-One-Shoe-Out 留一雙鞋交叉驗證

為何採留一雙鞋：同一雙鞋的多張照片若同時出現在訓練與驗證，會造成資料洩漏、評估虛高。改以鞋為單位分組、每次保留一整雙作驗證、輪替 32 次，數字才具參考性。
完整微調為何失敗：2,800 萬參數對應 32 個獨立標籤 → 過度擬合至「永遠輸出平均值」，R² 為 −1.6（低於直接猜平均）。凍結特徵抽取層後，模型才會真正隨輸入變化。
解析度測試：224 與 384 像素的濕式 R² 僅差約 0.04，影像壓縮對成效影響有限。

08 · 結果

成效驗證結果

逐步逼近資料可支撐的上限（以 32 折交叉驗證濕式 R² 為準）

方法	R²（濕式）	平均誤差 MAE
完整微調	−1.6	—（退化為平均值）
凍結特徵層	0.07	0.065
＋去背	0.18	0.056
＋分區放大（出貨版）	~0.32	0.054

出貨版以全 32 雙資料訓練（泛化能力已由 32 折交叉驗證估算）；模型版本 cv-convnext_tiny-v1，濕式平均誤差 MAE ≈ 0.054。

09 · 第二層

第二層：本地語言模型生成中文報告

模型預測值 → 本地語言模型（gemma4:26b）→ 繁體中文三段報告

摩擦係數數值對一般使用者較不直觀。第二層將數值交由本地大型語言模型（gemma4:26b，全程於機器內運算、不經外部雲端，約 7–14 秒），生成「整體評估／具體分析／建議行動」三段易讀報告。

「根據您提供的檢測數據，目前的評估結果為 安全（Safe），鞋底摩擦力表現尚在穩定範圍內⋯⋯前掌與後跟的濕地摩擦係數分別為 0.539 與 0.542，兩者差異極小且均維持在安全等級⋯⋯可以繼續放心穿著，但建議留意鞋底紋路是否因長期使用而變平。」
— 模型對某橡膠涼鞋樣本的實際輸出（節錄）

10 · 結論

結論：資料量是目前的主要限制

v1 為諮詢級估算工具，非安全保證

v1 已能穩定運作、輸出隨輸入變化、優於基準（猜平均值），足以支撐系統上線並啟動資料累積循環。
目前 R²~0.32（約解釋三分之一的變異）。此為 32 雙新鞋樣本下的上限，而非模型架構限制（已測試多種架構）。
提升準確度的關鍵在於資料 —— 尤其磨損舊鞋／低摩擦係數／「建議更換」等級樣本（目前為 0 筆）。

🔁 資料累積循環：每批新資料 → 增量訓練 → 模型更準確 → 更多使用 → 更多資料。第一版的核心價值，在於啟動此循環。

方法說明 — 安全分級

🎚️ 防滑安全分級標準

模型估出濕地摩擦係數（COF）後，依下表切成三級。門檻對齊 ASTM F3445「SR 防滑」合格線（＝與貴公司 FRT 檢測報告同一套 ASTM F2913 整鞋測法），非任意訂定。

濕地 COF	消費者端	協場端評級	說明
≥ 0.40	🟢 安全	A	防滑達合格，可繼續穿
0.30 – 0.40	🟡 注意	B	防滑邊際，濕滑地面留意
< 0.30	🔴 請換鞋	C	防滑不足，建議更換

安全線 0.40
ASTM F3445「SR 防滑」乾／濕合格門檻；與貴司 FRT 報告同一套 ASTM F2913 測法。佐證：人在地面 DCOF＜0.41 開始改變步態、NFSI 濕地板可接受線 0.42。

危險線 0.30
公認高滑倒風險線：NFSI 濕地板高風險、SATRA「正常走路下限」、生物力學走路所需摩擦係數約 0.20 之上保留安全餘裕。

為何以「濕地」為主
消費者最危險的情境是下雨／潮濕地面，故以濕地 COF 為主要分級基準（乾地另計、非風險主因）。

⚖️ COF 數字與測試表面／介質綁定、不可跨方法直接比較。我們將切點錨在同測法的 ASTM F3445；精確切點可再與貴公司對齊 FRT 報告的測試表面／介質條件後微調（程式單一處即可生效）。

Step 1 — 取得入口

🚪 三角色平台入口

三個角色、同一套後端，跑在貴公司 GX10 地端正式站（24 小時運行），固定網址 gx10.ai-cto.app。消費者走 LINE（掃官方帳號 → 選單）；鞋廠／後台用電腦開網址、帳密登入。

📱

消費者 · LINE

手機 LINE 掃描下方 QR → 加入官方帳號 → 由選單「開始檢測」進入 LIFF

🟢 正式站@062dlfjq

⚙️ 測試站@223qfcmm

能做什麼

拍／傳三張鞋底照（前掌／後跟／全底）
看防滑分數＋等級＋磨耗熱圖
本地語言模型白話建議
歷史檢測紀錄

🏭

鞋廠 · 研發工作台

電腦瀏覽器開網址 → 帳密登入

開啟鞋廠工作台

https://gx10.ai-cto.app/vendor

種子帳號

帳號 vendor@example.test

密碼 Test1234!

能做什麼

上傳鞋款送驗（材質＋型號＋樣本標籤）
COF／等級／熱圖／模型解讀
歷史款比對（研發資料庫）
跨公司資料隔離

🛠️

後台 · 管理端

電腦瀏覽器開網址 → 帳密登入

開啟後台管理

https://gx10.ai-cto.app/admin

種子帳號

管理員 admin@shoetec.test

唯讀 readonly@shoetec.test

密碼 Test1234!

能做什麼

系統儀表板（用戶／檢測量／服務健康）
模型版本管理（CV ＋ LLM）
用戶紀錄、系統紀錄（審計）
角色權限（管理員可寫／唯讀可讀）

Step 2 — 跟著走一遍

⭐ 角色用戶路徑測試

下面三幕是「同一筆檢測」從消費者上傳、到鞋廠研發、到後台監看的完整流程。標注前後台聯動的地方，前台一動、後台同步出現。

💡 建議方式：一支手機（LINE 掃官方帳號扮消費者）＋一台電腦（開鞋廠工作台 / 後台）。先用消費者端上傳三張鞋底照、看報告，再到後台看這筆檢測進了統計、模型版本是哪一版。

消費者上傳鞋底照→ CV 模型 + 本地 LLM→ 看分數 / 熱圖 / 報告→ 後台統計 + 模型版本

消費者：上傳鞋底照、拿報告

消費者

做什麼

手機 LINE 掃描官方帳號 QR → 加入好友 → 由選單開啟檢測
依指引拍／選三張鞋底照（前掌／後跟／全底），可選材質
送出 → 等 AI 運算（影像模型 + 本地語言模型）

✅ 該看到乾／濕 COF 兩個分數＋防滑等級（安全／注意／建議換鞋）＋磨耗熱圖＋一段繁中換鞋建議；回首頁可在「最近一次結果」看到它，歷史頁也有。

🔎 前後台聯動後台「系統儀表板」的「今日檢測次數」會 +1；這筆會進「近 7 日檢測量」。

鞋廠：送驗鞋款、比對歷史

鞋廠

做什麼

用 vendor@example.test / Test1234! 登入鞋廠工作台
「上傳檢測」→ 傳三張鞋底照＋選材質＋填鞋款型號＋樣本標籤 → 開始預測
看結果頁；再到「歷史款比對」看研發資料庫

✅ 該看到結果頁含精確 COF（兩位小數）＋綜合防滑評級（A/B/C）＋磨耗熱圖（去背鞋底原比例、半透明疊）＋模型解讀（鞋底老師傅口吻）＋「CV 模型 v1」；歷史頁列出本公司送驗鞋款。

🔎 資料隔離每家鞋廠只看得到自己的資料（跨公司存取會被擋）。

後台：監看系統與模型版本

管理員

做什麼

用 admin@shoetec.test / Test1234! 登入後台
看「系統儀表板」：總用戶、今日檢測、近 7 日量、服務健康狀態
進「模型版本」：看現在啟用的 CV 模型與本地 LLM

✅ 該看到服務健康：主 API / CV 推理 / 本地 LLM / 資料庫 = 正常；模型版本頁顯示 CV 模型 friction-cv v1（驗證 MAE 0.054） ＋ 本地 LLM gemma4 26B。

🔎 權限用唯讀帳號 readonly@shoetec.test 登入 → 看得到資料、但寫入動作（如切換模型）被擋。

底層怎麼運作

🧠 前端 / 後端 · AI 管線總覽

一筆檢測從上傳到報告，會經過這幾關。CV 推理與自架 LLM 跑的是真實模型（非假資料）。

📤

上傳三張照

消費者／鞋廠送出前掌·後跟·全底鞋底照

前端 → API

→

👁️

CV 推理（ml-infer）

去背 → 切三段 → ConvNeXt 模型 → 乾／濕 COF ＋等級＋遮擋顯著性熱圖

真實模型 v1

→

💬

自架 LLM（Ollama）

把 COF 數字＋鞋款資訊 → 繁中三段「鞋底老師傅」口吻報告

gemma4:26b · 自架

→

📄

報告呈現

前台看分數／熱圖／報告；後台進統計

DONE

🔒

資料全留地端、不出雲：正式站（貴公司 GX10）的影像辨識與語言模型皆於機房內運算、不傳送任何第三方雲端。內測階段暫借雲端 GPU 的做法已結束 —— 現在每一筆檢測都在貴公司自己的機器上完成。

系統韌性 — 雲端 vs 地端實測對比

🔬 雲端測試站 vs 貴公司地端正式站 — 同規格實測

同一支測試程式、同一天、同一組鞋底照，分別在雲端資料中心卡（RunPod A40，月租約 NT$10,000）與貴公司機房 GX10（買斷，零月租）實測（2026-07-03）。回答兩個問題：地端跑 AI 夠不夠快？多人同時用扛不扛得住？

① 一筆完整檢測（上傳三張照 → 影像分析 → AI 報告）

環境	影像分析（CV）	AI 報告生成（LLM）	端到端一筆
☁️ 雲端 A40	約 5–6 秒	約 8–9 秒	約 13.3–14.8 秒
🏠 地端 GX10	約 2 秒	約 11–12 秒	約 13.5–14.5 秒

✅ 端到端體感相同（一筆都約 14 秒）：資料中心卡文字生成較快，但 GX10 的影像前處理反而快兩倍以上 —— 兩相抵銷，使用者感受不到差異。

② 多人同時出報告（LLM 併發壓測：每等級 24 筆、約 250 字繁中報告）

同時人數	☁️ 雲端 A40		🏠 地端 GX10		錯誤
	回應中位 p50	p95	回應中位 p50	p95	兩邊
1 人	5.2s	5.2s	5.7s	5.9s	0
2 人	6.2s	6.4s	9.1s	10.9s	0
4 人	8.5s	10.4s	11.0s	18.1s	0
8 人	17.8s	19.5s	28.1s	29.8s	0

全程 0 錯誤（兩邊皆是）
1～8 人同時、共 192 筆報告，沒有任何一筆失敗；等待變長是「排隊」不是「當機」。

地端夠用
GX10 單人 5.7 秒出報告；8 人同時最慢也在 30 秒內。對「幾個人同時出報告」的實際場景綽綽有餘。

地端的獨有優勢
零月租（A40 跑 24 小時月費約萬元）、資料全留機房不出雲、24 小時待命不用開關機。

✅ 結論：雲端卡適合「臨時要更多算力」的測試場景；日常正式營運放地端 GX10 最划算也最安全 —— 速度體感相同、資料不出門、沒有月租錶在跳。

現況

📊 示範數據 · 後續事項 · 重要說明

3 角色平台

消費者 / 鞋廠 / 後台

32 雙

附 ASTM 報告的訓練鞋款

R² 0.32

濕式 32 折 LOSO（v1）

~10 秒

一筆端到端（CV＋LLM）

項目	狀態	說明
三角色平台＋端到端	已完成	本地 Demo 已可走完整流程
L1 真實 CV 模型 v1	已完成	去背＋三 crop，濕式 R²~0.32
L2 本地 LLM 報告	已完成	gemma4:26b 繁中三段報告
正式環境（貴公司 GX10 地端）	已上線	24 小時運行、開機自動恢復；入口見本頁上方
補訓練資料（磨損鞋／低 COF）	進行中	提升準度的唯一槓桿（見下）
英文報告／多模態（圖文一起餵 LLM）	規劃中	v2 範圍

⚠️

重要說明：v1 是「諮詢級估算器」，不是安全保證。它從 32 雙全新鞋學成，沒見過磨損舊鞋與「該換」等級，準度天花板被資料量框住（濕式 R²~0.32）。要變準，真正的槓桿是資料，不是模型 —— 補更多鞋（尤其磨損／低 COF）就能透過資料累積循環持續優化。這也正是這套系統的長線價值。

🖥️ 地端正式站 — 24 小時運行 · 即時監控

🔌 雲端測試站 — 自助開機 / 關機

🔬 影像辨識模型是怎麼做出來的

把一張鞋底照片，變成防滑安全分數

訓練資料的實際狀況

標籤是金級的，但鎖在 PDF 裡

資料探勘：四項關鍵議題

模型方法：聚焦於「整底 → 兩個數值」

方法一：移除背景雜訊（去背）

方法二：分區放大（前中後三段）

還試了什麼：多切區塊 ＋ 二值化

嚴謹的驗證方法：32 折交叉驗證（LOSO）

成效驗證結果

第二層：本地語言模型生成中文報告

結論：資料量是目前的主要限制

🎚️ 防滑安全分級標準

🚪 三角色平台入口

消費者 · LINE

鞋廠 · 研發工作台

後台 · 管理端

⭐ 角色用戶路徑測試

消費者：上傳鞋底照、拿報告

鞋廠：送驗鞋款、比對歷史

後台：監看系統與模型版本

🧠 前端 / 後端 · AI 管線總覽

🔬 雲端測試站 vs 貴公司地端正式站 — 同規格實測

📊 示範數據 · 後續事項 · 重要說明

還試了什麼：多切區塊＋二值化