В данных должны содержаться три обязательных поля:
- дата и время - event_time
- идентификатор пользователя uid
- имя события event_name
events_count = events.groupby('event_name').agg({'uid': 'count'})
в первом приближении так, то пользователи могут вызывать одно и тоже событие по нескольку раз, например, открывать окно чата с сервисом, поэтому правильнее будет использовать количество уникальных пользователей на каждом этапе воронки.
users_count = events.groupby('event_name').agg({'uid': 'nunique'}).sort_values(by='uid', ascending=False)
Комментариев нет:
Отправить комментарий