Commit Graph

2 Commits

Author SHA1 Message Date
mAi
fdac496a6f mAi: #10 - Anti-AI-Text-Lint im Build
tools/anti-ai-lint.py: Python-Linter (stdlib + yq) prueft jede
build/<domain>/index.html gegen die Blacklist in
tools/anti-ai-blacklist.yaml. HTML wird via html.parser auf sichtbaren
Text reduziert (Skripte/Styles werden ignoriert), dann werden Vokabel-
Substrings (DE+EN, case-insensitive) und Regex-Patterns gematcht.
Severity warn = Build geht durch, fail = Build bricht ab.

Whitelist-Mechanismen:
- HTML-Kommentar im Markup: <!-- anti-ai-allow: term1, term2 -->
- Per-Site in site.yaml: anti_ai_allow: [term1, term2]

Integration in build.sh als Schritt 4/4, mit --skip-lint fuer
Notfaelle. Dockerfile installiert python3 zusaetzlich; nur im
Builder-Stage, kein Effekt aufs Caddy-Image.

Tests via tools/test-anti-ai-lint.sh: synthetische AI-Fixture wird
korrekt geflagged, Whitelists unterdruecken Hits, fail-Severity
triggert exit 1, neutraler Text exit 0.

Initial-Lauf auf 59 bestehenden Sites: 2 warn (killusion.de
"revolutionaer" in ironischem Kontext, kilofant.de "robust"),
0 fail. Cleanup ist Folge-Issue.

README + docs/geo-seo-guideline.md aktualisiert mit der konkreten
Tool-Position.
2026-04-30 02:50:50 +02:00
mAi
d33ce9ea55 mAi: #8 - GEO+SEO Guideline für m's Web-Projekte
Recherche-Output: docs/geo-seo-guideline.md. Enthält:
- GEO-Grundlagen mit harten Zahlen (Princeton-Paper, +40% Sichtbarkeit;
  Top-Third-Regel 44.2% der ChatGPT-Citations)
- Konkrete Hebel: Schema.org/JSON-LD, E-E-A-T, llms.txt-Realitätscheck,
  Anti-AI-Text-Filter, Off-Site/Multi-Source, Crawler-Steuerung
- SEO 2026 Baseline (Helpful Content im Core, INP <200ms, EEAT)
- Stack-Übersetzung: onepager, flexsiebels.de, msbls.de, paliad.de,
  youpc.org mit konkreten Maßnahmen pro Stack
- Checkliste pro neuer Site
- Maintenance-Routinen (monatlich, quartalsweise, jährlich)
- 19 Quellen mit URLs

Implementierung nicht im Scope. Folge-Issues pro Stack später.
2026-04-29 14:30:37 +02:00