반응형
차례

개요

오랜만에 티스토리에 새 글을 쓰는 것 같다.  그동안 회사일도 바쁘기도 했지만 티스토리 글을 정리하는데 시간을 주로 할애하다 보니 정작 새 글은 작성할 시간이 없었던 것 같다.   이전에 작성했던 글들은 주로 생각 없이 즉흥적으로 작성하다 보니 오타도 많았고 포맷도 중구 남방, 중복되는 그림이나 자료도 있었고 해서 맘먹고 최대한 정리하고자 하였다.

 

글을 정리하는 과정에 내용을 잘라내서 다른 곳으로 옮기기도 하고 지우기도 하였는데 이 과정에 티스토리 에디터에 많은 태그들이 생성되었는데 이 것들이 지저분하게 보이기도 하지만 티스토리를 저품질로 보낼 수도 있겠구나 싶을 정도로 문제가 많다는 사실을 새롭게 알게 되었다.   물론 이 현상이 어제오늘 일이 아니었을 것이고 많은 블로거들도 이미 알고 있는 사실이겠지만 나와 같은 초보 블로거에게는 새로운 충격적인 사실이었던 만큼 글로서 정리하고자 한다.

 

글 복사 후 붙여 넣기 할 때 발생되는 현상

내 블로그에서 글을 복사해서 다른 곳에 붙여 넣기 하거나 타 사이트에서 글을 복사해서 내 블로그에 붙여 넣기 할 때 블로그 화면에는 아무 이상 없이 잘 붙여 넣기 한 것처럼 보이지만 HTML 태그를 보게 되면 쓰레기 태그들이 많이 붙어있는 것을 볼 수 있다.  쓰레기 태그라는 것은 웹페이지에 보이기에는 특별한 의미가 없는대도 불구하고 여러 번 반복되어서 나오는 태그를 의미하는 것으로 그냥 필자가 붙인 이름이다.  몇 가지 사례로 이 쓰레기 태그를 살펴보도록 하겠다

사례 1. 타사이트에서 글을 복사해서 직접 붙여 넣기 한 경우

아련한  자태의
그 심오함은
백의 얼의 자랑이며
강인한 뿌리는
유구한 역사의 어머니시며
그 우아한 품위의 꽃잎은
영원한 평화를 구 가 함이니
오묘한 빛깔이
겨레 구심의 민족 신앙 이외다
당신께서
위대한 민족성을 배웠고
내 나라가 소중함을 알았소이다
"무궁화 삼천리 화려강산"에
애국가 노래하는 겨레 가슴에
영원히 심고 가꿀 것 이외다.

 

위의 글은 타사이트에서 김석겸 님의 "무궁화"라는 시를 복사 붙여 넣기 한 것이다.  보기에는 특별한 문제가 없어 보인다.  이 글의 HTML 태그를 살펴보면 아래와 같다.

<p><span style="color: #000000;">아련한 &nbsp;자태의</span><br /><span style="color: #000000;">그 심오함은</span><br /><span style="color: #000000;">백의 얼의 자랑이며</span><br /><span style="color: #000000;">강인한 뿌리는</span><br /><span style="color: #000000;">유구한 역사의 어머니시며</span><br /><span style="color: #000000;">그 우아한 품위의 꽃잎은</span><br /><span style="color: #000000;">영원한 평화를 구가함이니</span><br /><span style="color: #000000;">오묘한 빛깔이</span><br /><span style="color: #000000;">겨레구심의 민족 신앙이외다</span><br /><span style="color: #000000;">당신께서</span><br /><span style="color: #000000;">위대한 민족성을 배웠고</span><br /><span style="color: #000000;">내 나라가 소중함을 알았소이다</span><br /><span style="color: #000000;">"무궁화 삼천리 화려강산"에</span><br /><span style="color: #000000;">애국가 노래하는 겨레 가슴에</span><br /><span style="color: #000000;">영원히 심고 가꿀 것이외다.</span></p>

 

문장 안에 <span style="color #000000;">***</span>라는 구문이 반복적으로 여러 번 나와서 태그가 엄청 지저분하게 보이는데 사실 이 태그는 현재 화면에 별 영향을 주지 않는 없어도 전혀 상관없는 쓰레기 같은 태그인 것이다.  다름 사례를 보면 이것이 더욱더 쓰레기 같다는 생각이 들 것이다.

 

사례 2. 복사한 글을 다시 복사한 경우

위 무궁화 시의 일부를 다시 복사해보겠다

1회 복사 : 아련한  자태의 그 심오함은 백의 얼의 자랑이며

2회 복사 : 아련한  자태의 그 심오함은 백의 얼의 자랑이며

3회 복사 : 아련한  자태의 그 심오함은 백의 얼의 자랑이며

4회 복사 : 아련한  자태의 그 심오함은 백의 얼의 자랑이며

5회 복사 : 아련한  자태의 그 심오함은 백의 얼의 자랑이며

 

 

이상과 같이 1회 복사부터 5회 복사까지 나열해보았는데 사실 복잡한 글을 편집하다 보면 5회가 아니고 10회 이상 복사하는 경우도 있어서 이런 경우가 특별한 경우가 아니고 흔히 벌어지는 사례라고 볼 수 있다.   그럼 위의 복사 글에 대한 HTML 태그는 어떻게 보일까

<p>1회 복사 : <span style="color: #000000;">아련한 &nbsp;자태의 </span><span style="color: #000000;">그 심오함은 </span><span style="color: #000000;">백의 얼의 자랑이며</span></p>
<p><span style="color: #000000;"><span style="color: #333333;">2회 복사 :<span>&nbsp;</span></span><span style="color: #000000;">아련한 &nbsp;자태의<span>&nbsp;</span></span><span style="color: #000000;">그 심오함은<span>&nbsp;</span></span><span style="color: #000000;">백의 얼의 자랑이며</span></span></p>
<p><span style="color: #000000;"><span style="color: #000000;"><span style="color: #333333;">3회 복사 :<span>&nbsp;</span></span><span style="color: #000000;">아련한 &nbsp;자태의<span>&nbsp;</span></span><span style="color: #000000;">그 심오함은<span>&nbsp;</span></span><span style="color: #000000;">백의 얼의 자랑이며</span></span></span></p>
<p><span style="color: #000000;"><span style="color: #000000;"><span style="color: #000000;">4<span style="color: #333333;">회 복사 :<span>&nbsp;</span></span><span style="color: #000000;">아련한 &nbsp;자태의<span>&nbsp;</span></span><span style="color: #000000;">그 심오함은<span>&nbsp;</span></span><span style="color: #000000;">백의 얼의 자랑이며</span></span></span></span></p>
<p><span style="color: #000000;"><span style="color: #000000;"><span style="color: #000000;"><span style="color: #000000;"><span style="color: #000000;">5</span><span style="color: #333333;">회 복사 :<span>&nbsp;</span></span><span style="color: #000000;">아련한 &nbsp;자태의<span>&nbsp;</span></span><span style="color: #000000;">그 심오함은<span>&nbsp;</span></span><span style="color: #000000;">백의 얼의 자랑이며</span></span></span></span></span></p>

 

와 정말 ㅎㄷㄷ하다.

<span style="color: "#000000;">***</span>이라는 구문이 복사 횟수만큼 반복해서 늘어나는 것이다.  이 정도면 정말 쓰레기 태그라는 이름이 무색하지 않다.

 

그러면 타 블로거들이 추천하는 메모장에 붙여 넣기 한 후에 다시 복사해오는 방법은 어떠할까?

 

사례 3. 메모장에 복사 후 다시 복사해서 붙여 넣기 한 경우

많은 블로거들이 타사이트에서 글을 복사할 때 블로그에 직접 붙여 넣지 말고 메모장에 한번 붙여 넣기 한 후에 다시 복사해서 블로그에 붙여 넣기 하라고 추천한다.  

 

아련한  자태의
그 심오함은
백의 얼의 자랑이며
강인한 뿌리는
유구한 역사의 어머니시며
그 우아한 품위의 꽃잎은
영원한 평화를 구 가 함이니
오묘한 빛깔이
겨레 구심의 민족 신앙 이외다
당신께서
위대한 민족성을 배웠고
내 나라가 소중함을 알았소이다
"무궁화 삼천리 화려강산"에
애국가 노래하는 겨레 가슴에
영원히 심고 가꿀 것 이외다.

 

 

위의 글은 메모장에 붙여 넣기 한 후에 다시 복사하여 붙여 넣기 한 글이다.  그럼 HTML 태그를 살펴보자.

<p>아련한&nbsp;&nbsp;자태의 <br />그&nbsp;심오함은 <br />백의&nbsp;얼의&nbsp;자랑이며 <br />강인한&nbsp;뿌리는 <br />유구한&nbsp;역사의&nbsp;어머니시며 <br />그&nbsp;우아한&nbsp;품위의&nbsp;꽃잎은 <br />영원한&nbsp;평화를&nbsp;구가함이니 <br />오묘한&nbsp;빛깔이 <br />겨레구심의&nbsp;민족&nbsp;신앙이외다 <br />당신께서 <br />위대한&nbsp;민족성을&nbsp;배웠고 <br />내&nbsp;나라가&nbsp;소중함을&nbsp;알았소이다 <br />"무궁화&nbsp;삼천리&nbsp;화려강산"에 <br />애국가&nbsp;노래하는&nbsp;겨레&nbsp;가슴에 <br />영원히&nbsp;심고&nbsp;가꿀&nbsp;것이외다.</p>

 

블로그에 직접 붙여 넣기 한 것보다는 깨끗해 보이기는 하지만 &nbsp;가 많이 보인다.  그렇다.  메모장에 붙여 넣은 뒤 다시 복사 붙여 넣기 할 경우에는 공백이 &nbsp;로 변환되어 보이는 것이다.  이것도 또한 HTML 태그를 볼 때 깔끔해 보이지 않으며 복사한 글이라는 단서를 구글이나 네이버에 제공하고 있는 격이다.

타사이트 글 복사 붙여 넣기 해도 괜찮을까

시인성 저하 원인

티스토리 에디터로 무궁화라는 시를 직접 타이핑할 때 보이는 HTML을 작성하여 복사 붙여 넣기 한 경우에 비해 얼마나 깨끗할지 비교해 본다.

<p>아련한 자태의<br />
그 심오함은<br />
백의 얼의 자랑이며<br />
강인한 뿌리는<br />
유구한 역사의 어머니시며<br />
그 우아한 품위의 꽃잎은<br />
영원한 평화를 구가함이니<br />
오묘한 빛깔이<br />
겨레구심의 민족 신앙이외다<br />
당신께서 <br />
위대한 민족성을 배웠고<br />
내 나라가 소중함을 알았소이다<br />
"무궁화 삼천리 화려강산"에<br />
애국가 노래하는 겨레 가슴에<br />
영원히 심고 가꿀 것이외다.</p>
<p>&nbsp;</p>

 

직접 타이핑한 문장은 위와 같이 <p>와 </br>의 조합으로만 나열되어 있다.

태그 편집을 위한 HTML 편집 모드이지만 기본 편집 모드와 크게 다를 바 없이 보여서 직접 타이핑한 태그는 편집할 때도 시인성이 매우 좋아질 수밖에 없을 것이다.

 

저품질 블로그 우려

블로그 하는 사람들에게는 저품질 평가라는 치명적인 두려움들이 항상 마음 한편에 있는 것 같다.  물론 필자 같은 초보 블로거들은 한 번도 경험해보지도 못한 것이어서 실감은 나지 않지만 블로그를 접하다 보면 여기저기서 자주 보게 되는 블로거들의 필수 체크 항목 중의 하나인 것임은 틀림없는 듯싶다.

블로그가 저품질 평가를 받게 되는 이유는 여러 가지가 있을 수 있겠지만 그중에 하나가 남의 글을 복사해서 붙여 넣기 하는 것이라고 한다.  사실 평상시에도 필자는 저품질 평가의 기준은 도대체 뭘까라는 사실이 많이 궁금했었다. 

 

"다음이나 네이버가 아닌 구글이 남의 티스토리나 네이버 블로그와 같은 남의 서버에 있는 블로그의 내용이 복사 붙여 넣기 한 것인지 여부를 어떻게 판단하는 걸까?"

 

타 블로거들은 한 개의 글이 완성돼서 올려지는 속도를 체크하거나 여러 개 글이 짧은 시간에 동시에 올라가면 복사 붙여 넣기라고 판단한다고 하는데 구글이 과연 남의 서버에서 그런 정도까지 데이터를 가져갈 수 있는 것인지 의아하게 생각된다.

 

필자의 생각으로는 구글의 서버에  DB화 된 여러 블로그의 글들과 현재 대상 블로그 글의 내용을 비교해서 중복성 여부를 판단하는 것이 본 검증방법일 것이고, 그 이전에 본문 글에 &nbsp; 라든가 <span sytle....>라는 구문이 반복적으로 삽입되어 있는 가 하는 여부를 체크하는 것이 가장 기초적인 복사 붙여 넣기 검증방법일 거라는 생각이다.

 

맺음말

타사이트에서 글을 복사해서 자기 블로그에 붙여 넣기 할 때 <span style=...> 태그나 &nbsp;태그가 반복적으로 생성된다.  이러한 쓰레기 태그들은 HTML을 편집할 때 시인성을 떨어뜨릴 뿐만 아니라 구글이 저품질 블로그로 평가하게 되는 단서가 될 수도 있다. 

블로그를 운영하다 보면 거의 대부분의 글을 자신이 창의적으로 작성하여 게재하겠지만 경우에 따라서는 타사이트에서 부분적으로 복사해서 붙여 넣기 하는 경우도 피치 못하게 발생할 수 있다.  또는 자기 블로그 내에서 다른 곳으로 이동 복사하는 경우도 비일비재할 것이다.

 

이런 경우는 본문 내용만 수정한 후에 문제없다고 생각하지 말고 HMTL태그에 숨겨진 쓰레기 태그들도 반드시 제거하도록 하자.   쓰레기 태그들을 쉽게 지울 수 있는 방법에 대해서 이 글에서는 다루지 않았지만 notepad++이나 editplus 등과 같은 texteditor를 이용하여 검색 바꾸기 기능 등을 활용하면 쉽고 빠르게 작업할 수 있을 것이다.

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기
Stats