[java] HTML Entities escape하기
들어가며 HTML 코드가 들어가 있는 데이터를 문자열만 추출해야 할 상황이 생겼다. 정규식을 사용해서 어찌저찌 태그는 다 제거했는데 Html Entity로 표기된 특수문자는 그대로 남아있었다. 처음엔 만 공백으로 치환했다. 그런데 데이터를 더 확인해보니 자주 쓰이는 >, <, 그 외 &숫자;형식으로 된 처음 보는 Entity들이 가득했다. 일일히 replace하기를 포기하고... 구글링을 해본다. ...역시 사람은 도구(?)를 사용해야 할 줄 안다고. 아파치와 스프링에서 관련 Util 클래스를 제공해주고 있었다. HTML Entity? HTML에서
Java
2020. 10. 25. 16:34
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- getPath
- 정규표현식 플래그
- 특수문자 치환
- file
- csv 라이브러리
- getAbsolutePath와
- FileNameFilter
- github actions 구성요소
- getCanonicalPath
- csv to bean
- MPEG-2 TS
- 다이나믹프록시
- github actions 기초
- 그런RESTAPI로괜찮은가
- 정규경로
- Longest Consecutive Sequence
- CGLIB프록시
- hls.js
- AOP
- Best Time to Buy and Sell Stock
- java8 stream
- sockjs
- 코프링
- self-descriptive
- opencsv
- 정규표현식 패턴
- 문자열인코딩과 문자집합의 차이
- websocket handshake
- HtmlUtils
- github actions components
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
글 보관함