import config
import requests
import pandas as pd
import json
import time
from pandas import json_normalize

import matplotlib.pyplot as plt
import seaborn as sns
sns.set_theme(style='whitegrid', palette='dark')


with open('strava_tokens.json') as json_file:
    strava_tokens = json.load(json_file)

if strava_tokens['expires_at'] < time.time():
    response = requests.post(
                        url = 'https://www.strava.com/oauth/token',
                        data = {
                                'client_id': config.client_id,
                                'client_secret': config.client_secret,
                                'grant_type': 'refresh_token',
                                'refresh_token': strava_tokens['refresh_token']
                                }
                    )
    new_strava_tokens = response.json()

    with open('strava_tokens.json', 'w') as outfile:
        json.dump(new_strava_tokens, outfile)

    strava_tokens = new_strava_tokens


with open('strava_tokens.json') as check:
  data = json.load(check)


# Get the tokens from the file to connect to Strava
with open('strava_tokens.json') as json_file:
    strava_tokens = json.load(json_file)

# Loop through all activities
url = "https://www.strava.com/api/v3/activities"
access_token = strava_tokens['access_token']

# Get the first page of activities from Strava with all fields
r = requests.get(url + '?access_token=' + access_token)
r = r.json()
    
df = json_normalize(r)
df.to_csv('strava_activities_all_fields.csv')


# Using the Strava API with a specific header to retrive activity data
header = {'Authorization': 'Bearer ' + access_token}
param = {'per_page': 200, 'page': 1}
r = requests.get(url, headers=header, params=param).json()


activities = json_normalize(r)

# new dataframe with desired columns
columns = [
            "id",
            "name",
            "start_date_local",
            "type",
            "distance",
            "moving_time",
            "elapsed_time",
            "total_elevation_gain",
            "end_latlng",
            "location_country",
            "flagged",
            "has_heartrate",
            "average_heartrate",
            "max_heartrate",
            "average_speed",
    ]

activities = activities[columns]

# Export activities file as a csv 
# to the folder this script runs in
activities.to_csv('strava_activities.csv')


activities.head()


# Create a distance in miles column
conv_fac_kilometers_miles = 0.621371 # conversion factor
activities['distance_miles'] = (activities['distance']*conv_fac_kilometers_miles)/1e3

# Convert m/s to min/mile
activities['minute_mile'] = 1/(activities['average_speed']/26.822)

# Convert dates to datetime type
activities['start_date_local'] = pd.to_datetime(activities['start_date_local'])

# Create a day of the week and month of the year columns
activities['day_of_week'] = activities['start_date_local'].dt.day_name()
activities['month_of_year'] = activities['start_date_local'].dt.month
activities['week_of_year'] = activities['start_date_local'].dt.isocalendar().week

# Convert times to timedeltas
activities['moving_time'] = pd.to_timedelta(activities['moving_time'])
activities['elapsed_time'] = pd.to_timedelta(activities['elapsed_time'])

# Convert start date to years
activities['year'] = pd.DatetimeIndex(activities['start_date_local']).year

activities.head()


# date range for the training of the half marathon, excluding the actual race day
start_date_training = '2021-10-23'
end_date_training = '2021-12-04'

mask_training = (activities['start_date_local'] > start_date_training) & (activities['start_date_local'] <= end_date_training)
df_training = activities.loc[mask_training]

# date for the race day
date_race = '2021-12-05'
date_race2 = '2021-12-06'
mask_race = (activities['start_date_local'] >= date_race) & (activities['start_date_local'] <= date_race2)
df_race = activities.loc[mask_race]


# Construct dataframe with week number column and values column
df2 = df_training.loc[:, ["distance_miles"]]
df2["week_of_year"] = activities['week_of_year']

# Sum up weekly values
df3 = (
    df2
    .groupby("week_of_year")
    .sum()
    .reset_index()
)

ax = sns.barplot(x='week_of_year', y='distance_miles', data=df3, color = 'black')
ax.set(xlabel="week_of_year", ylabel = "distance, miles")

plt.show()


print("Total miles ran in training:", round(sum(df_training['distance_miles'])))

Total miles ran in training: 139


days_of_week = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday' ]

ax = sns.barplot(x='day_of_week', y='distance_miles', data=df_training, order=days_of_week, ci=None, color='black')
ax.set(xlabel="day of week", ylabel = "distance, miles", title = "Average Miles per Day")
plt.xticks(rotation=45)
plt.show()


# training data
ax = sns.scatterplot(x='distance_miles', y='minute_mile', data=df_training, color = 'black')

# race day data
ax1 = sns.scatterplot(x='distance_miles', y='minute_mile', data=df_race, color = 'red', s=100)

ax.set(xlabel="distance, miles", ylabel = "speed, minute mile")
plt.axhline(y=7.5, color = "black", linestyle='--', label="target race pace")

# mark race data
plt.text(12.5,7.7,'Race')

plt.legend()
plt.show()


# training data
ax = sns.scatterplot(x='average_heartrate', y='minute_mile', data=df_training, color = 'black')

# race day data
ax1 = sns.scatterplot(x='average_heartrate', y='minute_mile', data=df_race, color = 'red', s=100)

ax.set(xlabel="average_heartrate", ylabel = "speed, minute mile")
plt.axhline(y=7.5, color = "black", linestyle='--', label="target race pace")

# mark race data
plt.text(161,7.7,'Race')

plt.legend()
plt.show()

	id	name	start_date_local	type	distance	moving_time	elapsed_time	total_elevation_gain	end_latlng	location_country	flagged	has_heartrate	average_heartrate	max_heartrate	average_speed
0	6598004451	Morning Run	2022-01-29T09:57:57Z	Run	6444.5	1978	2030	52.1	[41.960498029366136, 3.0399949103593826]	Spain	False	True	144.9	168.0	3.258
1	6589161188	Lunch Run	2022-01-27T12:17:24Z	Run	9846.4	2962	2972	12.6	[41.96275033056736, 3.0380767956376076]	Spain	False	True	155.7	168.0	3.324
2	6573787184	Burn Baby	2022-01-24T12:48:09Z	Run	6444.1	1893	1934	11.4	[41.96095953695476, 3.038990255445242]	Spain	False	True	160.2	181.0	3.404
3	6559064384	Afternoon Run	2022-01-21T14:38:44Z	Run	9944.9	3022	3510	56.3	[41.96046022698283, 3.040398834273219]	Spain	False	True	149.3	174.0	3.291
4	6538818076	Afternoon Run	2022-01-17T17:06:26Z	Run	9663.8	2963	3133	54.1	[41.96291017346084, 3.0405751056969166]	Spain	False	True	149.5	169.0	3.261

	id	name	start_date_local	type	distance	moving_time	elapsed_time	total_elevation_gain	end_latlng	location_country	...	has_heartrate	average_heartrate	max_heartrate	average_speed	distance_miles	minute_mile	day_of_week	month_of_year	week_of_year	year
0	6598004451	Morning Run	2022-01-29 09:57:57+00:00	Run	6444.5	0 days 00:00:00.000001978	0 days 00:00:00.000002030	52.1	[41.960498029366136, 3.0399949103593826]	Spain	...	True	144.9	168.0	3.258	4.004425	8.232658	Saturday	1	4	2022
1	6589161188	Lunch Run	2022-01-27 12:17:24+00:00	Run	9846.4	0 days 00:00:00.000002962	0 days 00:00:00.000002972	12.6	[41.96275033056736, 3.0380767956376076]	Spain	...	True	155.7	168.0	3.324	6.118267	8.069194	Thursday	1	4	2022
2	6573787184	Burn Baby	2022-01-24 12:48:09+00:00	Run	6444.1	0 days 00:00:00.000001893	0 days 00:00:00.000001934	11.4	[41.96095953695476, 3.038990255445242]	Spain	...	True	160.2	181.0	3.404	4.004177	7.879553	Monday	1	4	2022
3	6559064384	Afternoon Run	2022-01-21 14:38:44+00:00	Run	9944.9	0 days 00:00:00.000003022	0 days 00:00:00.000003510	56.3	[41.96046022698283, 3.040398834273219]	Spain	...	True	149.3	174.0	3.291	6.179472	8.150106	Friday	1	3	2022
4	6538818076	Afternoon Run	2022-01-17 17:06:26+00:00	Run	9663.8	0 days 00:00:00.000002963	0 days 00:00:00.000003133	54.1	[41.96291017346084, 3.0405751056969166]	Spain	...	True	149.5	169.0	3.261	6.004805	8.225084	Monday	1	3	2022

Authenticate with Strava¶

Data Retrieval¶

Data Exploration¶

Data Conversion¶

Get Only Half Marathon Training Activities¶

Graphing¶

Weekly Distance¶

Weekly Distance Plan¶

Days of the Week Analysis¶

Pacing¶

Heart Rate¶