워드프레스 블로그 운영을 하다 보니 페이지 색인 생성 관련 내용이 꽤 중요해 보여서 따로 저장해서 메모해 본다.
오개념이 있을 수도 있음..
페이지 색인 (Indexing) 이란
<색인>이라는 용어가 처음에는 잘 와 닿지 않았는데, 영어 Indexing 이라는 용어를 보고 이해되었다. 인덱싱이라고 하는 것이 더 직관적인 것 같다.
워드프레스나 구글이 한국 플랫폼이 아니다 보니 안 그래도 익숙치 않은 용어들이 더 생소한 한글 번역어로 번역되거나, 하나의 용어가 여러 방식으로 번역되어 혼용되는데, 이런 점 때문에 워드프레스가 더 어렵게 느껴지는 듯 하다..
여튼.
색인, 혹은 인덱싱 Indexing 은 <검색 엔진이 내 사이트의 콘텐츠를 원활하게 읽고 제3자에게 제공할 수 있도록 내 사이트를 구조화 해 두는 프로세스>라고 생각하면 되겠다.
Google 같은 검색 엔진은 크게 아래 세 단계로 웹페이지를 처리하는데, 2번 indexing 이 잘 되어야 3번 검색 노출도 잘 되는 것.
- 크롤링(Crawling): 검색엔진(구글 – Googlebot)이 인터넷을 탐색하며 사이트 내 새로운 페이지를 발견
- 색인/인덱싱(Indexing): 검색엔진이 발견된 페이지의 콘텐츠를 분석한 후 인덱싱(indexing)해서 데이터베이스에 저장
- 검색 결과 제공(검색 노출): 제3자가 검색엔진에 검색시, 검색엔진은 인덱싱(indexing)된 페이지를 검색 결과로 보여줌
페이지 색인 (Indexing) 확인하기
인덱싱, 즉 색인 관련 상세 내용은 구글은 Google Search Console (구글 서치 콘솔), 네이버는 네이버 서치어드바이저(Search Advisor)에 가면 볼 수 있다. 그런데 아래에서 보다시피 구글과 네이버의 indexing 페이지 수량이 너무 다른데 왜인지는 모르겠다.
Google Search Console
[Google Search Console 에서 내 블로그의 색인 (indexing) 현황]
네이버 서치어드바이저
[네이버 서치어드바이저의 내 블로그의 색인 (indexing) 현황]
페이지 색인화 주의/참고사항 메모
1. 워드프레스 설정
워드프레스 Dashboard > Settings > Reading (대시보드 > 설정 > 읽기) 로 이동한 후, “Discourage search engines from indexing this site (검색 엔진이 이 사이트를 색인화하지 못하도록 합니다)”라는 옵션 체크 해제
2. XML 사이트맵(sitemap.xml)를 생성해서 웹마스터도구(webmaster tools)에 제출
사이트맵(Sitemap)이란 사이트의 구조를 크롤러가 찾기 쉽도록 사이트 내 페이지들을 목록으로 정리한 파일이다.
웹마스터 도구에 사이트맵(sitemap.xml)을 제출해야 하는데 워드프레스에서는 플러그인을 이용해서 제출하면 편하다.
나는 Rank Math 를 사용할 예정인데, 지금은 귀찮으므로 이 부분에 대해서는 나중에 추가로 포스팅 해야지
3. SSL 인증서 설치
HTTPS 사이트가 보안성이 좋아서 검색 엔진에서 더 높은 평가를 받는다고 한다.
내 사이트는 아마존 lightsail 로 만들어서 그런지 처음부터 SSL 인증서 설치되어 있슴.