function cut_sense($matne_harf, $l_harf ,$return=1 ) {
if ( strlen($matne_harf) > $l_harf){
$end='...';
}else{
$end='';
}
if ( function_exists('mb_strcut') ){
$matne_harf = mb_strcut ( $matne_harf, 0 , $l_harf , "UTF-8" );
}else{
$matne_harf =substr($matne_harf, 0, $l_harf);
}
$text=''.$matne_harf.''.$end.'';
if ( $return == 1){
return $text;
}else{
print $text;
}
}
Iranian php programmer (farhad zand +989383015266)
mb_strcut
(PHP 4 >= 4.0.6, PHP 5)
mb_strcut — Получение части строки
Описание
$str
, int $start
[, int $length
[, string $encoding
]] )mb_strcut() вычленияет подстроку из строки также, как mb_substr(), но оперирует байтами вместо символов. Если начало вырезаемой части попадает между байтами одного символа, функция вырежет подстроку, начиная с первого байта этого символа. Это существенное отличие от substr(), которая просто вырежет подстроку, начиная с середины символа, и нарушит тем самым последовательность байт в строке.
Список параметров
-
str -
Исходная строка string.
-
start -
Позиция начала подстроки в байтах bytes.
-
length -
Длина подстроки в байтах bytes.
-
encoding -
Параметр
encodingпредставляет собой символьную кодировку. Если он опущен, вместо него будет использовано значение внутренней кодировки.
Возвращаемые значения
mb_strcut() возвращает часть строки
str, заданную аргументами
start и length.
Смотрите также
- mb_substr() - Возвращает часть строки
- mb_internal_encoding() - Установка/получение внутренней кодировки скрипта
I found this function to be extremely useful.
Here is a practical example, showing the difference between substr(), mb_substr() and mb_strcut():
<?php
mb_internal_encoding('UTF-8');
$string = 'cioèòà';
var_dump(
substr($string, 0, 6),
mb_substr($string, 0, 6),
mb_strcut($string, 0, 6)
);
?>
Output:
string(6) "cioè?"
string(9) "cioèòà"
string(5) "cioè"
Explanation:
$string is long 9 bytes
c - 1 byte
i - 1 byte
o - 1 byte
è - 2 bytes
ò - 2 bytes
à - 2 bytes
substr() works with bytes, so it returns a string which is exactly 6 bytes long. Thus, it truncates the ò character.
mb_substr(), instead, works with characters, so it returns a string which is exactly 6 characters long (but in this case is 9 bytes long).
mb_strcut() works exactly as substr(), but, if the last byte appears to be truncated, it simply omits the character.
When you use
$string = mb_strcut($string, 6);
you can know for sure that strlen($string) <= 6. But no unicode characters will be truncated.
I hope my comment could finally be a simple explanation.
What the manual and the first commenter are trying to say is that mb_strcut uses byte offsets, as opposed to mb_substr which uses character offsets.
Both mb_strcut and mb_substr appear to treat negative and out-of-range offsets and lengths in the basically the same way as substr. An exception is that if start is too large, an empty string will be returned rather than FALSE. Testing indicates that mb_strcut first works out start and end byte offsets, then moves each offset left to the nearest character boundary.
diffrence between mb_substr and mb_substr
example:
mb_strcut('I_ROHA', 1, 2) returns 'I_'. Treated as byte stream.
mb_substr('I_ROHA', 1, 2) returns 'ROHA' Treated as character stream.
# 'I_' 'RO' 'HA' means multi-byte character
