Notepad++ hướng dẫn extract email từ file chứa nhiều nội dung
Bạn đang có nhu cầu lọc email từ file chứa nhiều nội dung khác, có rất nhiều phần mềm có phí hoặc trả phí để thực hiện việc này. hôm nay mình hướng dẫn các bạn lọc email từ file chứa nhiều nội dung bằng phần miền miễn phí notepad + +, phần mền này chắc có rất nhiều bạn sử dụng cho sửa các văn bản dạng txt.
File ban đầu có dạng sau
Bước 1: bạn sử dụng notepad ++ mở file có chứa email, sau đó mở phần tìm kiếm và thay thế của notepad bằng cách sử dụng phím tắt “Ctrl + H” hoặc trên menu bạn chọn Search -> Replace
Bảng tìm kiếm và thay thế hiện lên.
Trong mục Find what bạn điền nội dung sau:
(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)
Trong phần Replace with bạn điền như sau.
\n$1\n
mục đích sẽ tìm kiếm email và tách ra thành từng dòng.
Bạn nhớ tích vào Regular Expression như hình dưới.
sau đó click Replace All
Kết quả các bạn có email ở các dòng riêng biệt.
Bước 2: Chúng ta sẽ đánh dấu toàn bộ các dòng có email.
Tiếp theo cũng trong phần tìm kiếm, các bạn chọn vào tab Mark trong phần find what các bạn điền.
(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)
sau đó chọn các phần tick như hình chú ý các bạn tick vào Bookmark line và Regular expression để ra kết quả.
sau đó click Mark All
Kết quả chúng ta thu được là các dòng có chứa email được mark như sau.
Bước 3: Xóa các nội dung không liên quan trong file.
Để thực hiện bước này trên thanh menu bạn tìm đến Search chọn Bookmark, chọn Remove Unbookmarked Lines sau bước này kết quả bạn sẽ được 1 file chỉ chứa email.
Chúc các bạn thành công.