
들어가며 HTML 코드가 들어가 있는 데이터를 문자열만 추출해야 할 상황이 생겼다. 정규식을 사용해서 어찌저찌 태그는 다 제거했는데 Html Entity로 표기된 특수문자는 그대로 남아있었다. 처음엔 만 공백으로 치환했다. 그런데 데이터를 더 확인해보니 자주 쓰이는 >, <, 그 외 &숫자;형식으로 된 처음 보는 Entity들이 가득했다. 일일히 replace하기를 포기하고... 구글링을 해본다. ...역시 사람은 도구(?)를 사용해야 할 줄 안다고. 아파치와 스프링에서 관련 Util 클래스를 제공해주고 있었다. HTML Entity? HTML에서
Java
2020. 10. 25. 16:34
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- csv 라이브러리
- 콜레이션변경
- github actions 구성요소
- github actions 기초
- online ddl
- hibernate 쿼리 로그
- jpa 쿼리 로그
- file
- opencsv
- utf8mb3
- 4Way Handshake
- http커넥션
- 도메인구성요소
- 쿼리 파라미터 바인딩
- CGLIB프록시
- AOP
- read timeout
- mysql 이모지
- github actions components
- tcp커넥션
- 문자집합변경
- spring boot3 쿼리 로그
- mysql 온라인 ddl
- 콜레이션
- 코프링
- TCP연결
- csv to bean
- 엔티티와값객체
- 이모지입력오류
- spring retry
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함