Jak unikać wycieków danych osobowych w blogach

Ten artykuł przedstawia praktyczne wskazówki i najlepsze praktyki dotyczące ochrony prywatności podczas pisania blogów i unikania wycieków wrażliwych informacji.

Popularną platformą darmową i open source jest GitHub Pages, która cieszy się dużą popularnością wśród blogerów.
Jednak wersja darmowa wymaga publicznego repozytorium, aby umożliwić publiczny dostęp. Po upublicznieniu repozytorium artykuły oznaczone jako wersje robocze również mogą być dostępne z repozytorium Git.
Chociaż opublikowane artykuły rzadko zawierają wrażliwe informacje, repozytorium źródłowe bloga open source może ujawnić dane osobowe. Poniżej przedstawiono kilka typowych słów kluczowych wycieków informacji. Zapraszamy do uzupełnienia w komentarzach.

Słowa wrażliwe

Chińskie słowa kluczoweAngielskie słowa kluczowe
Hasłopassword
Kontoaccount
Dowód osobistyid
Karta bankowacard
Alipayalipay
WeChatwechat
Numer telefonuphone
Adres domowyaddress
Miejsce pracycompany
Karta ubezpieczenia społecznegocard
Prawo jazdydriver
Paszportpassport
Karta kredytowacredit
Kluczkey
Plik konfiguracyjnyini
Poświadczeniecredential
Nazwa użytkownikausername

Wyszukiwanie za pomocą wyrażeń regularnych:

(hasło|konto|dowód osobisty|karta bankowa|alipay|wechat|numer telefonu|adres domowy|miejsce pracy|karta ubezpieczenia społecznego|prawo jazdy|paszport|karta kredytowa|username|password|passwd|account|key\s*:|\.ini|credential|card|bank|alipay|wechat|passport|id\s*:|phone|address|company)

Jeśli do edycji bloga używasz VSCode, możesz użyć wyszukiwania wyrażeń regularnych do szybkiego przeszukania całej witryny w poszukiwaniu potencjalnych miejsc wycieków informacji.

Historia Git

Historia Git może zawierać wycieki informacji, które można łatwo zeskanować za pomocą prostego skryptu.

W przypadku własnego repozytorium można wyczyścić historię w następujący sposób. Jeśli potrzebujesz zachować informacje historyczne, nie czyść historii.

Upewnij się, że rozumiesz znaczenie polecenia. Usunie ono historię, więc postępuj ostrożnie i wykonaj kopię zapasową ważnych danych przed operacją.

git reset --soft ${first-commit}
git push --force

Inne sposoby skanowania repozytorium

https://github.com/trufflesecurity/trufflehog

  • Znajdź, zweryfikuj i przeanalizuj wyciekające poświadczenia
  • 17,2k gwiazdek
  • 1,7k forki

img

Inne sposoby publikowania blogów

  • Github Pro pozwala publikować prywatne repozytoria na Pages, Pro 4 dolary miesięcznie
  • Ustaw jako prywatne repozytorium, opublikuj na Cloudflare Pages
  • Oddzielne repozytoria: jedno prywatne do przechowywania artykułów w trakcie edycji, jedno publiczne do przechowywania artykułów gotowych do publikacji

Jeśli twój blog korzysta z systemu komentarzy zależnego od GitHub, takiego jak giscus, nadal potrzebujesz publicznego repozytorium.

Dobre nawyki vs. dobre mechanizmy

Omawiając problem wycieków danych osobowych w blogach open source, wielu ludzi uważa, że nie ma problemu, jeśli nie przekażesz wrażliwych informacji do repozytorium.

To jest bezużyteczne podsumowanie, takie jak żądanie, aby programiści nie pisali błędów. Jest to prawda, ale bezużyteczne. Poleganie na nawykach w celu ochrony danych osobowych jest niepewne. Nie ufaj轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易轻易 łatwo zapomnieć.

Czasem pisanie może zawierać pewne tymczasowe wypowiedzi, szczególnie blogi techniczne programistów, krótkie skrypty mogą być napisane przypadkowo, nie zawsze pamiętając o użyciu zmiennych środowiskowych, więc istnieje pewne prawdopodobieństwo pozostawienia wrażliwych informacji.

Wiemy, że większość ludzi rozumie, co to są dobre nawyki, dlatego nie będziemy tu omawiać dobrych nawyków, a głównie podzielimy się, jak unikać wycieków danych osobowych za pomocą mechanizmów.

Po pierwsze, podziel repozytoria, repozytorium robocze i repozytorium publikacji oddzielnie, wszystkie artykuły opublikowane na GitHub Pages są przejrzane i nie będą miały artykułów w stanie draft.

Można również użyć Github Action, aby skanować wrażliwe informacje przy każdej przesłanej zmianie. Jeśli zostaną znalezione wrażliwe informacje, zmiana nie zostanie przesłana. Zobacz więcej w trufflehog

Przedstawione tutaj wyrażenie regularne jest tylko prostym przykładem, nie jest zintegrowane z żadnym procesem. Możesz dostosować je do swoich potrzeb i zintegrować z procesem.

Referencje