Αυτή η συνάρτηση κωδικοποιεί ένα string data σε UTF-8, και επιστρέφει την κωδικοποιημένη έκδοση. Το UTF-8 είναι ένας standard μηχανσιμός που χρησιμοποιείται από την Unicode για κωδικοποίηση wide χαρακτήρων τιμών σε ένα byte stream. Η UTF-8 είναι διαφανής σε απλούς ASCII χαρακτήρες, είναι self-synchronized (που σημαίνει ότι είναι δυνατό για ένα πρόγραμμα να διακρίνει πού αρχίζουν οι χαρακτήρες σε ένα bytestream) και μπορεί να χρησιμοποιηθεί με κανονικές συναρτήσεις σύγκρισης strings για ταξινόμηση και άλλα. Η PHP κωδικοποιεί τους UTF-8 χαρακτήρες σε μέχρι τέσσερα bytes, ως εξής:
Κάθε b αναπαριστά ένα bit που μπορεί να χρησιμοποιεί για να αποθηκεύσει δεδομένα χαρακτήρων.