Phạm vi an toàn: Hướng dẫn này chỉ áp dụng cho môi trường QA, staging hoặc pre-production thuộc sở hữu hoặc được uỷ quyền của bạn. Nội dung bao gồm các mẫu chẩn đoán, kiểm thử và quan sát cho tích hợp CAPTCHA của chính bạn — không áp dụng cho bên thứ ba hoặc luồng không được phép.
Thời gian phản hồi của CAPTCHA solver thay đổi mạnh theo loại CAPTCHA, khu vực, tải và tích hợp. Hướng dẫn này cung cấp một phương pháp đo nhất quán cho môi trường của bạn — không phải tuyên bố nhà cung cấp nào nhanh nhất một cách phổ quát.
Vì sao cần benchmark trong môi trường của bạn
Độ trễ mạng từ data center của bạn, loại CAPTCHA cụ thể và tỷ lệ retry sẽ ảnh hưởng đến thời gian quan sát trong production. Các benchmark công khai chỉ mang tính tham khảo — kết quả trong môi trường của bạn có thể khác.
Phương pháp đo
Với mỗi loại CAPTCHA, chạy 200+ tác vụ từ pipeline nội bộ. Với mỗi tác vụ ghi: dấu thời gian gửi in.php, dấu thời gian poll thành công đầu tiên từ res.php và tổng wallclock. Tính trung vị, P90 và P99.
Mẫu bảng đo
| Loại CAPTCHA | Mẫu | Trung vị | P90 | P99 |
|---|---|---|---|---|
| reCAPTCHA v2 | 200 | điền | điền | điền |
| reCAPTCHA v3 | 200 | điền | điền | điền |
| Cloudflare Turnstile | 200 | điền | điền | điền |
| GeeTest v3 | 200 | điền | điền | điền |
| Image / OCR | 200 | điền | điền | điền |
Các giá trị chỉ mang tính tham khảo cho môi trường của bạn và có thể thay đổi theo loại CAPTCHA, khu vực, tải và tích hợp; chỉ phục vụ tham khảo nội bộ.
Khả năng tương thích và phạm vi
Khi so sánh nhà cung cấp, hãy đảm bảo mỗi bên xử lý cùng một loại CAPTCHA. So sánh táo với táo: reCAPTCHA v2 với reCAPTCHA v2; không phải image OCR với Turnstile.
Lập kế hoạch capacity bằng dữ liệu của bạn
Sau khi có phân phối của riêng bạn, tính capacity bền vững: tasks/phút = 60 / trung_vị_giây * worker. Cộng thêm 30% buffer cho đột biến.
Benchmark script
import os, time, statistics, requests
API_KEY = os.environ['CAPTCHAAI_API_KEY']
SAMPLES = 200
def submit_recaptcha_v2(sitekey, pageurl):
r = requests.post('https://ocr.captchaai.com/in.php', data={
'key': API_KEY, 'method': 'userrecaptcha',
'googlekey': sitekey, 'pageurl': pageurl, 'json': 1,
}).json()
return r['request']
def wait(task_id):
t0 = time.time()
while True:
time.sleep(5)
rr = requests.get('https://ocr.captchaai.com/res.php', params={
'key': API_KEY, 'action': 'get', 'id': task_id, 'json': 1,
}).json()
if rr['status'] == 1:
return time.time() - t0
times = [wait(submit_recaptcha_v2(SITE, PAGE)) for _ in range(SAMPLES)]
print('trung vị', statistics.median(times))
print('p90', statistics.quantiles(times, n=10)[8])
print('p99', statistics.quantiles(times, n=100)[98])
Câu hỏi thường gặp
Có solver nào nhanh nhất một cách phổ quát không? Không. Kết quả thay đổi theo khu vực, loại, tải và tích hợp.
Các tuyên bố “độ chính xác giá trị tham khảo cho mẫu nội bộ” hay “có thời gian phản hồi cạnh tranh trong mẫu nội bộ” có hợp lệ không? Chỉ khi được hỗ trợ bởi phương pháp đã công bố và signoff. Ngược lại, hãy xem là tham khảo.
Khắc phục sự cố
| Vấn đề | Nguyên nhân thường gặp | Cách xử lý |
|---|---|---|
| Test không tìm thấy widget | Thay đổi selector hoặc thời điểm load | Kiểm tra selector và wait_for_selector trên staging |
CaptchaAI trả ERROR_NO_SLOT_AVAILABLE |
Hàng đợi đầy tạm thời | Thử lại với backoff trong pipeline nội bộ |
| Backend QA từ chối token | Sai action/sitekey/secret | Đối chiếu cấu hình backend với staging |
Khả năng quan sát
Hãy ghi nhật ký có cấu trúc cho mỗi lần chạy QA. Các chỉ số nên thu thập bao gồm: tổng thời gian lấy token, mã trạng thái HTTP, ID tác vụ và độ sâu hàng đợi. Tách các môi trường (development, staging, pre-production) thành các kênh riêng biệt và liên kết các bước thông qua một correlation id (ví dụ với OpenTelemetry). Khả năng phát lại toàn bộ kịch bản từ một id duy nhất sẽ cắt giảm thời gian chẩn đoán sự cố ít nhất một nửa.
Danh mục kiểm tra
- Phạm vi kiểm thử chỉ giới hạn trong ứng dụng của bạn hoặc tài nguyên đã được uỷ quyền.
- Khoá CaptchaAI nằm trong CI secret hoặc vault, không nằm trong mã nguồn.
- Mỗi lần chạy có thời gian gọi và mã trạng thái phản hồi được ghi lại.
- Có chính sách thử lại idempotent với giới hạn cho lỗi tạm thời.
- Bài kiểm thử có thể tái lập trên CI mà không cần can thiệp thủ công.
Ví dụ gọi QA
Đoạn mã Python dưới đây minh hoạ luồng tối thiểu để kiểm thử một CAPTCHA widget trên môi trường staging của bạn thông qua CaptchaAI.
import os
import requests
API_KEY = os.environ['CAPTCHAAI_KEY']
QA_PAGE_URL = os.environ['QA_PAGE_URL'] # ví dụ https://staging.example.com/qa-login
QA_SITE_KEY = os.environ['QA_SITE_KEY']
def submit_qa_recaptcha() -> str:
payload = {
'clientKey': API_KEY,
'task': {
'type': 'NoCaptchaTaskProxyless',
'websiteURL': QA_PAGE_URL,
'websiteKey': QA_SITE_KEY,
},
}
response = requests.post(
'https://api.captchaai.com/createTask',
json=payload,
timeout=30,
)
response.raise_for_status()
return response.json()['taskId']
def fetch_qa_result(task_id: str) -> dict:
payload = {'clientKey': API_KEY, 'taskId': task_id}
response = requests.post(
'https://api.captchaai.com/getTaskResult',
json=payload,
timeout=30,
)
response.raise_for_status()
return response.json()
Câu hỏi thường gặp
Quy trình này có chạm vào lưu lượng production không?
Không. Mọi ví dụ giả định một môi trường được uỷ quyền như staging.example.com hoặc một domain QA do bạn sở hữu. Hãy tái tạo cấu hình CAPTCHA của production trong bản sao staging của riêng bạn.
Có thể đặt API key trực tiếp trong mã không?
Không. Hãy nạp khoá thông qua trình quản lý secret của CI, biến môi trường hoặc vault. Khoá đã bị commit vào kho mã phải được xoay vòng ngay lập tức.
Bạn khuyến nghị gì cho lỗi tạm thời?
Thử lại idempotent kèm exponential backoff (ví dụ 1s, 2s, 4s) và một giới hạn trên. Lỗi mạng, mã 5xx và ERROR_NO_SLOT_AVAILABLE đều phù hợp để thử lại; lỗi xác thực kéo dài thì không nên.
Hướng dẫn liên quan an toàn
- CaptchaAI quickstart
- Kiểm thử QA CAPTCHA được uỷ quyền
- Kiểm thử endpoint CAPTCHA trên biểu mẫu của bạn
- Khi kiểm thử trình duyệt thất bại còn API thành công: gỡ lỗi
- Giải reCAPTCHA v2 qua API
- Giải Cloudflare Turnstile qua API
- Giải GeeTest v3 qua API
Xác thực tích hợp CAPTCHA của bạn trong môi trường nội bộ với CaptchaAI.